单卡就能跑的大模型等效GPT-3！Meta发布大语言模型LLaMA_天天报资讯

您当前的位置：科技 >

2023-02-26 07:38:46 来源：手机网易网分享

ChatGPT的热度稍有平息，蛰伏已久的Meta就迅速放出“大招”：

还声称，效果好过GPT，偏向性更低，更重要的是所有尺寸均开源，甚至13B的LLaMA在单个GPU上就能运行。

消息一出，直接在网上掀起一阵热度，不到一天时间，相关推文的浏览量就已经快破百万。

(资料图片仅供参考)

同在Meta的LeCun当然也得为这次大模型的热度“添油加柴”，LLaMA直接给他写了段“AI”Rap：

（不得不说效果不错，还双押了，skr～）

不过话说回来，这次Meta的LLaMA模型到底如何？

一起来一探究竟。

数学编程写求职信统统都能拿下

Meta发布的LLaMA是通用大语言模型，原理就不多赘述，和以往的大语言模型一样：

这次，Meta之所以一次给出不同大小的LLaMA模型，论文中给出了这样的解释：

也就是说，较小的模型规模加上比较大的数据集，获得的性能可能会比更大规模模型的要好很多。

一方面，小规模模型需要的计算能力和资源相对来说都会少很多，另一方面，它还能基于更多数据集训练更多token，更容易针对特定的潜在产品用例进行重新训练和微调。

除了一把给出四种尺寸的LLaMA，Meta这次还直接开源了这个大语言模型。

更重要的是，Meta为了让自己的工作与开源兼容，使用的都是公开的数据。

而这把开源，也不只利好开发人员，同样也利好Meta。

LLaMA模型也有着其他大语言模型的通病：会产生偏见性、有毒或者虚假的内容。开源吸引来的更多的研究可以帮助解决这个问题。

不过讲了这么多，Meta的这个LLaMA模型到底能做啥？

扎克伯格直接在Facebook放出豪言，这是AI大语言模型里的新SOTA：

论文的最后也给出了一些栗子：

比如说，给出几个数字，它直接就能找出其中的规律并续写，还balabala解释了一大通。

ChatGPT之前擅长写的求职信LLaMA也能轻松拿下。

编程、写小说也是分分钟的事儿：

效果超越GPT-3

当然按照惯例，在最后LLaMA还是得和其他大模型做做比较（是骡子是马，咱得拉出来遛遛）。

其中，大家比较熟悉的就是GPT-3，直接看看它们俩之间的效果比较：

相较于有1750亿参数的GPT-3，最多只有650亿参数LLaMA赢麻了：它在大多数基准上都要优于GPT-3。

比如说常识推理：

或者说一些基础问题的解决：

又比如说阅读理解：

甚至，研究人员还提供了一组评估模型偏见性和毒性的基准，得分越高，偏见就越大：

你对Meta这次的LLaMA怎么看呢？如果还想了解更多可以戳文末链接～

论文地址：https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/参考链接：[1] https://ai.facebook.com/blog/large-language-model-llama-meta-ai/[2] https://twitter.com/GuillaumeLample/status/1629151231800115202[3] https://twitter.com/ylecun/status/1629243179068268548

关键词： meta 大语言模型

>>返回频道首页

返回本网站首页

[责任编辑：ruirui]

单卡就能跑的大模型等效GPT-3！Meta发布大语言模型LLaMA_天天报资讯(2023-02-26)
离婚后，17万粉丝的直播账号归男方还是女方？(2023-02-26)
造车烂尾坑了谁？全球速递(2023-02-26)
每日动态!她用ChatGPT写了一篇文章，日赚14000元！(2023-02-26)
法拉第未来计划加大招聘力度，为FF 91 Futurist量产做准备_环球时讯(2023-02-25)
单卡就能跑的大模型等效GPT-3！Meta发布大语言模型LLaMA_天天报资讯(2023-02-26)
离婚后，17万粉丝的直播账号归男方还是女方？(2023-02-26)
造车烂尾坑了谁？全球速递(2023-02-26)
每日动态!她用ChatGPT写了一篇文章，日赚14000元！(2023-02-26)
佳谷食品周文军：食品企业如何利用食药同源“弯道超车”(2023-02-25)
升温预警！全国大部地区“回暖” 春意扑面而来天天视讯(2023-02-25)
德邦证券金华龙：做强金融主责，赋能实体经济快速进阶！(2023-02-25)
IMF驻华首席代表Steven BARNETT：更好的利用资本和人力进行经济改革(2023-02-25)
中金公司首席经济学家彭文生：美国经济今年衰退的可能性大于50%(2023-02-25)
【全球快播报】美联储前董事Randall S. KROSZNER：中国人口老龄化将驱动全球利率上升(2023-02-25)
全球微资讯！富华国际集团董事总裁赵勇：营商环境整体提升，通州的发展十年前就已布局(2023-02-25)
北银理财董事长步艳红：今年重点关注债券利率波动和信用利差变化两个方面|全球快播报(2023-02-25)
中林国控实业集团与彝良县政府开展座谈会并达成相关合作框架(2023-02-25)
G20青年委员-段聪利(2023-02-25)
订购1.2万+台！商用车新能源首届创富+高峰论坛暨开瑞小象EV上市圆满落幕(2023-02-25)
植物医生多举措推动高质量生态保护，开启地球友好模式(2023-02-25)
德泽润物而无声融形取意而高远(2023-02-25)
段聪利增补受聘为中国管理科学研究院人才教育培训中心客座教授(2023-02-25)
圣女果和车厘子入“绿通” 鲜活农产品运输新规提升车辆通行效率(2023-02-25)
两新群体化身社区“治理力量”(2023-02-25)
全球热点！可别一口一块撑腰糕了小心“食糕团综合征”吃坏肚子(2023-02-25)
最新！放假通知来了！|环球观点(2023-02-25)
内蒙古煤矿坍塌事故东西两侧救援通道已全部打通(2023-02-25)
海南在境外举办多场推介会企业点赞海南自贸港建设带来更多机遇_天天热点(2023-02-25)
最高可领1600元！“京彩·绿色”消费券3月起发放世界快看(2023-02-25)
央行：制约消费回暖的因素有望缓解|独家(2023-02-25)
今日看点：央行：中长期保持消费稳定增长既有必要又有空间(2023-02-25)
黄奇帆：产业金融市场庞大科技公司或金融机构谁也不能取代谁(2023-02-25)
增持避险资产、警惕信托等产品违约风险，社科院金融所副所长张明对投资者提出这些建议……-环球讯息(2023-02-25)
央行货币政策委员会委员王一鸣：今年增速5%以上应该不成问题(2023-02-25)

热点排行

本站违法和不良信息举报联系邮箱： 58 55 973@qq.com

关于我们| 客服中心| 广告服务| 建站服务| 联系我们