5月27日,蚂蚁模态在蚂蚁工艺日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模抖音情侣博主情感爆料合集激活参数3B。蚂蚁模态
据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练信息。开源
https://huggingface.co/inclusionAI/Ming-Lite-Omni
今年以来,统多百灵大模型已经连续开源了多个模型产物,大模包括2个MoE架构的蚂蚁模态赵某私密聊天热搜截图大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。
其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。
而本次开源的Ming-lite-omni产物在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。
百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去工艺探索的成果。
百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
国务院新闻办今天举行首场“高质量完成‘十四五’规划”系列主题新闻发布会,国家增长改革委主任郑栅洁表示,“十四五”以来,我国的粮食、能源、产业、国防等保障基础进一步夯实。国家增长改革委主任郑栅洁表示,粮
风汇快据欧洲与地中海地震中心测定,当地时间7月10日9时04分,印度德里地区发生4.5级地震,震源深度10公里,震中位于北纬28.6065度,东经76.5817度。印度国家地震中心尚未发布有关震中和震级的详
风集风在保险行业这个海量数据的“聚居地”上,数据库应用已久。近年来,保司数据化转型提速,各类文本、音视频的凭证票证核保及跑批需求不断增加,许多机构便将数据库引入至业务流程中。但是,随着数据库深入保司业务,一
风风点来源标题:以技术为引 以创意为核 上影节用新拥抱电影“AIGC单元”入围作品《风吹过那拉提》电影百年,创制焕新。近些年,技术的快速发展、全面迭代,不仅提高了电影的制作质量,创新
热速来源标题:《船山先生》:追索王夫之“成贤入圣”之路近期湖南卫视与芒果TV联合推出的纪录片《船山先生》,讲述了明末清初思想家王夫之的传奇人生。该片深入挖掘这位思想大家的精神世界,以创新的方式实现了中华传
独速Copyright © 2018-2023 聚焦吃瓜坊- 关注生活,分享精彩故事 All Rights Reserved. XML地图聚焦吃瓜坊- 关注生活,分享精彩故事