首页 > 今日推荐 > 正文

腾讯自研混元大模型正式亮相,拥有超千亿参数规模

时间:  2023-09-08 08:55:26   来源: 财经涂鸦 




(资料图片仅供参考)


9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。腾讯将全面拥抱大模型。

腾讯混元大模型作为腾讯自研的实用级通用大模型,目前已经接入腾讯50多个业务测试并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。未来它将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,开发不同产业场景的应用

今年6月,腾讯发布了行业大模型,覆盖领域有限。此次发布的混元通用大模型,将会支持更多行业。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。腾讯产业互联网将通过智能增强、数据增强、连接增强,持续助力产业增强。”

腾讯集团副总裁、混元大模型的负责人蒋杰介绍,面对“百模大战”的市场环境,腾讯的策略第一是从中文领域做攻克,让大模型具备更强的中文创作能力,完善服务中国企业时的本土化能力;第二是在复杂推理过程中,增强对大模型安全的管控能力。

腾讯掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。目前腾讯混元的参数规模超千亿,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

此外,腾讯研发团队还提出了思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。自研机器学习框架Angel让训练速度相比业界主流框架提升1倍,推理速度比业界主流框架提升1.3倍。

中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试结果显示,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现。

腾讯集团副总裁、云与智慧产业事业群COO、腾讯云总裁邱跃鹏表示,“云是大模型的最佳载体,大模型也将开创下一代云服务的全新形态。高效能的云产品、高水平的AGI能力,将加速企业在云上创新创造,AI native的应用、全新的交互方式将持续涌现。”

大模型带来的高水平智能,也将重新定义云上工具和应用。腾讯安全风控大模型、腾讯云AI代码助手、腾讯会议AI小助手等产品,都因为大模型能力的加持,为用户带来了更好的体验。

蒋杰现场展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。

比如腾讯会议AI小助手只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要,已正式开放试用申请。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率,相较于GPT3.5有明显的优势。

在文档处理方面,腾讯混元大模型支持数十种文本创作场景,能够一键生成标准格式文本,熟悉上百种Excel公式,支持自然语言生成函数,并基于表格内容生成图表。这些文档处理功能目前正在内测阶段,将在成熟后面向用户开放。

在广告业务场景,腾讯混元大模型支持智能化的广告素材创作,可以结合行业与地域特色,实现文字、图片、视频的自然融合。

腾讯云已全面接入Llama 2、Bloom等20多个主流模型,并支持直接部署调用。客户可以根据实际需求,既可以基于混元大模型,也可以基于开源模型,打造自己的行业大模型。


关键词:

娱乐新闻