点击上方关注 “终端研发部


 
设为“星标”,和你一起掌握更多数据库知识

果然还是阿里牛逼!每一次的更新都没有让我们失望

桶义千问作为一个开源模型,超越了美国最强的开源模型标杆Llama3-70B,甚至超过了百度文心4.0等中国闭源大模型。

1c9f0e3840e46bac5e5298110fc993e3.jpeg

Qwen2发布后两小时,Hugging Face联合创始人兼首席执行官克莱门特·德朗格(Clément Delangue)发推宣布,各位,HF开源大模型榜单新的第一出来了,Qwen2-72B!Qwen-VL在全球三个多模态大语言模型评测中也登过顶;

ad1a7f0a6076b38f8924983e3e17ef73.jpeg

补充一个知识点:

HuggingFace的开源大模型排行榜(Open LLM Leaderboard)是目前大模型领域最具权威性的榜单,收录了全球上百个开源大模型,测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。

这次阿里亮瞎了大家的双眼!

根据官方披露,通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中,Qwen2-72B一举斩获十几项世界冠军。

08586e20fb2a5225e5289a341d9bbefd.jpeg

Qwen1.5-110B登顶过另一个国际权威排行榜榜首;

52e6cdeb6e01e683d241bb5fa5d2a5b9.jpeg

CodeQwen1.5登顶过 Bigcode 模型排行榜

早在去年12月份,通义千问(Qwen-72B)表现抢眼,以73.6的综合得分在所有预训练模型中排名第一。

10281bb17c80eedae44b0b1f97ebc5f4.png

通义千问-72B登顶HuggingFace的Open LLM Leaderboard

Qwen2亮点省流总结:

- 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;

- 在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;

- 多个评测基准上的领先表现;

- 代码和数学能力显著提升;

- 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

0c0730d7a823bf317c028504ae80659b.png

自发布以来,Qwen系列开源模型的累计下载量突破了1600万,涌现了超过1500款基于Qwen二次开发的模型和应用。来自开发者的“催更”也在倒逼阿里云更紧迫的去迭代模型能力。

轮大模型开源能力,还是性能,还得是阿里!

希望阿里能带给我们更多的惊喜和意外,干!

回复 【idea激活】即可获得idea的激活方式
回复 【Java】获取java相关的视频教程和资料
回复 【SpringCloud】获取SpringCloud相关多的学习资料
回复 【python】获取全套0基础Python知识手册
回复 【2020】获取2020java相关面试题教程
回复 【加群】即可加入终端研发部相关的技术交流群
阅读更多
用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)


相信自己,没有做不到的,只有想不到的在这里获得的不仅仅是技术!



喜欢就给个“在看”
Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐