阿里巴巴开源1100亿参数版通义千问人工智能模型 模型推理时更加高效 – 蓝点网

  发布时间:2025-05-05 01:25:42   作者:玩站小弟   我要评论
阿里巴巴旗下通用人工智能研究团队目前已经推出参数高达 1100 亿的通义千问人工智能模型,和此前推出的同样相同,Qwen1.5-110B 版模型依然是开源免费提供的,任何人都可以获取该模型并根据需要进 。

阿里巴巴旗下通用人工智能研究团队目前已经推出参数高达 1100 亿的阿里通义千问人工智能模型,和此前推出的巴巴同样相同,Qwen1.5-110B 版模型依然是开源开源免费提供的,任何人都可以获取该模型并根据需要进行微调和使用。亿参

通义千问团队称近期开源社区陆续出现千亿参数规模以上的数版时更大型语言模型,这些模型都在各项评测中取得了杰出的通义推理成绩,通义千问现在也推出千亿规模参数的千问开源模型。

阿里巴巴开源1100亿参数版通义千问人工智能模型 模型推理时更加高效

Qwen1.5-110B 是人工基于通义千问 1.5 系列训练的模型,在基础能力评估中与 Meta-Llama3-70B 版媲美,模型模型在 Chat 评估中表现出色,加高包括 MT-Bench 和 AlpacaEval 2.0 测试。效蓝

该模型采用 Transformer 解码器架构,点网但包含分组查询注意力 (GAQ),阿里模型在推理时将会更加高效;110B 版模型支持 32K 上下文、巴巴支持英语、开源中文、法语、西班牙语、德语、俄语、日语、韩语、阿拉伯语、越南语等多种语言。

基准测试显示 Qwen1.5-110B 在基础能力方面与 Meta-Llama3-70B 版媲美,由于在这个模型中通义千问团队并没有对预训练方法进行大幅度改变,因此现在基础能力提升应该就是得益于增加模型 (参数) 规模。

阿里巴巴开源1100亿参数版通义千问人工智能模型 模型推理时更加高效

另一项测试似乎也证实这个观点,在与 Llama3-70B-Chat 以及 Qwen1.5-72B-Chat 相比,Qwen1.5-110B-Chat 能力都有提升,这表明在没有大幅度改变预训练方法的情况下,规模更大的基础语言模型也可以带来更好的 Chat 模型。

阿里巴巴开源1100亿参数版通义千问人工智能模型 模型推理时更加高效

有兴趣的用户可以阅读 Qwen1.5 博客了解该系列模型使用方法,包括 Qwen1.5-110B 的下载和使用等:https://qwenlm.github.io/blog/qwen1.5/

  • Tag:

相关文章

  • 《战地5》破坏系统更优秀 不再有随机性子弹偏差

    《战地5》是由EA DICE制作的一款第一人称射击类游戏,游戏有着丰富的剧情可以体验,画面精致,最近官方对游戏的破坏系统进行优化,一些房屋的倒塌、物品裂缝的出现等都更加符合物理现象,给玩家更真实的体验
    2025-05-05
  • 蔚来产品发布会将于6月15日举办 蔚来ES7将公布售价

    易车讯日前,我们从蔚来官方获悉,蔚来产品发布会将于6月15日举办,届时蔚来ES7将公布售价。蔚来ES7基于NT2.0技术平台打造而来,定位中大型5座SUV,车辆智能化水平与ET7和ET5两款车保持一致
    2025-05-05
  • 港服《勇者斗恶龙10离线版》试玩版上线 可继承存档

    今日4月30日),《勇者斗恶龙》系列最新作《勇者斗恶龙10:觉醒的五种族 离线版》港服试玩正式上线,PS5和PS4均可游玩。在试玩版中,玩家可以从游戏开头游玩到转生为五个种族之一后踏上旅程的故事为止,
    2025-05-05
  • 2021燕子河大年夜峡谷门票多少钱

    燕子河大年夜峡谷齐少约1700米,深约200米,景区内的风景好好,风景娟秀,是一个散山川好景与人文景没有雅相畅通收悟的旅游目标天,四时的风景各别,各具神韵,上里一起去体会一下有哪些好玩的处所。燕子河大
    2025-05-05
  • 值夜班的月亮婆婆的故事

    太阳公公工作了一整天,疲惫地躲到山前面歇息去了。月亮婆婆带着一群闪闪烁烁的小老婆星挂在了天空,天逐步黑了下来,夜晚来临了。月亮婆婆在干什么呢?月亮婆婆在值夜班呢。瞧!它们值班多么认真呀:月亮婆婆笑微微
    2025-05-05
  • 牧马人撒哈拉4xe荧光黄上市 限量200辆/售价54.99万元

    易车讯6月10日,Jepp牧马人撒哈拉4xe荧光黄特别版上市,车辆售价54.99万元,限量发售200辆。特别版是Jeep牧马人4xe中的首款特别版车型,车身配色为田纳西荧光黄。此前,燃油版牧马人曾带来
    2025-05-05

最新评论