首页 > 生活分享 > 免费教学 > iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端

iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端

发布时间:2024-04-24 22:47:37来源: 15210273549

4月23日,微软推出了开源轻量级AI模型Phi-3系列,宣称这是目前市面上性能最强、最具性价比的“小语言模型”。

该系列的最小版本Phi-3-mini虽然参数规模仅有38亿,但却展现了超越参数规模大一倍多的模型的性能,在多项基准测试中比Meta的Llama 3 8B更优异,而Phi-3-small和Phi-3-medium这两个版本甚至可以超越GPT-3.5 Turbo。

更令人瞩目的是,Phi-3-mini对内存的占用极少,可在iPhone 14搭载的A16 Bionic芯片上实现每秒12个token的生成速度,这意味着这款模型不用联网,可以直接在手机上运行。不仅如此,据透露,Phi-3的成本或只有同等性能模型的十分之一。

这样的模型对于网络资源受限或需要离线推理的场景来说,无疑是一大好消息。据微软介绍,印度企业已经开始用Phi-3模型来帮助资源紧缺的农民解决生产生活问题。但Phi-3系列并非没有缺点,其在事实性知识方面的表现并不理想,不过微软已经找到了相应的缓解之道。

 

手机上能跑的GPT-3.5级别模型

当地时间4月23日,微软推出了开源轻量级AI模型Phi-3-mini,这是其Phi家族的第4代模型。Phi-3-mini是Phi-3系列中最小的,参数只有38亿,未来几周内,微软还将推出该系列的另外两个版本Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)。

Phi-3模型是现有功能最强大、最具性价比的小语言模型(SLM),在各种语言、推理、编码和数学基准测试中,其性能优于相同大小和规模大一级的模型。”微软方面表示。

具体来看,Phi-3-mini采用了transformer架构,支持4K和128K上下文窗口,也是同类小模型中第一个支持128K的开源产品。

性能上,Phi-3-mini在多项基准测试中超过了参数规模大一倍多的Llama 3 8B(80亿参数),而Phi-3-small和Phi-3-medium超过了很多尺寸大得多的模型,如GPT-3.5 Turbo,而后者的参数规模高达1750亿。

图片来源:微软

由于Phi-3-mini对内存的占用极少,经过压缩后总体积可以大幅缩减至1.8GB,可在iPhone 14搭载的A16 Bionic芯片上实现每秒12个token的生成速度,意味着这款模型不用联网,可以直接在手机上运行。

Phi-3系列的惊艳表现来自于其训练方式。微软生成式AI研究院(GenAI Resaerch)副总裁Sébastien Bubeck表示,微软在开发Phi-3时力图确保输入的是高质量数据训练集。

微软技术报告显示,开发人员开发Phi-3时使用了3.3T tokens数据集,包括经过严格质量筛选的网络公开文档、精选的高质量教育数据和编程代码。此外,还有AI自己生成的“合成数据”,如数学、编码、常识推理、世界常识、心理科学等。高质量数据,再辅以独特的指令微调和RLHF训练,大幅提高了小语言模型的性能。

当然,Phi-3系列也有其缺点,这主要体现在事实性知识上,在相关的基准测试如TriviaQA上的表现就不如人意。不过,开发语言模型是性能和尺寸的平衡。微软透露,Phi-3模型本身参数中没能力存储太多事实和知识这一缺点的缓解方式是联网接入搜索引擎增强。

 

可离线使用,成本只有类似性能模型的十分之一

传统观点认为,大语言模型的关键点就在于“大”,参数越大,训练数据体积越大,性能就更强。微软推出轻量级的小语言模型,用意何在呢?

据微软自己的说法,像Phi-3这样的小语言模型特别适合以下场景:网络资源受限,需要在终端设备上推理或者离线推理的场景;需要避免延迟,快速响应至关重要的场景;成本受限的场景,特别是那些较为简单的任务。

Phi-3能够在手机上离线运行,成本大幅降低,从而大大降低了AI的实际使用门槛。

微软高管Eric Boyd就表示,企业客户经常发现像Phi-3这样的小模型更适合他们的定制应用程序,因为企业的内部数据集本来就规模不大,而且小模型需要的算力更少,成本也更为便宜。

Phi-3的价格不是稍微便宜一点,而是便宜得多,与具有类似功能的其他型号相比,成本差异可能是10倍的范围,”微软的Sébastien Bubeck对路透社表示。

微软已经在探索如何在资源有限的情况下应用Phi-3。据其介绍,总部位于印度的商业集团ITC,正在与微软合作将Phi-3用于农业领域,共同开发面向农民的应用程序Krishi Mitra,这一程序的覆盖范围达100万农民。

据悉,农民可以用当地语言向Krishi Mitra提问,该应用程序会立即以用户的本地语言提供详细的个性化响应,帮助他们解决农作物管理、病虫害控制、土壤健康、水资源保护、天气预报、市场联系和政府计划等相关问题。

免费教学更多>>

车企大卷智能语音,很多司机仍然在“捣鼓”屏幕?别被眼睛给骗了 跃迁抢占“智高点” 一汽奥迪上海车展大秀“新实力” 2025上海车展前瞻:捷途山海L9旗舰6座SUV惊艳亮相 2025上海车展前瞻:福特F-150猛禽实车抢先看,细节升级更霸气 2025款江淮钇为3:宣称电池永不自燃,是黑马还是陪跑者 2025年乳源瑶族自治县医疗卫生类高层次及紧缺专业人才校园招聘补充公告 2025年4月深圳光明区政务服务和数据管理局招聘一般类岗位专干公告(5人) 2025年始兴县青年就业见习基地招募见习人员公告(8人) 2025年中山市港口镇水务事务中心招聘勤杂工公告(6人) 2025年秦皇岛卢龙县公安局招聘警务辅助人员公告 2025年4月深圳小学光明学校曙光校区、狮山校区赴济南定点面向2025年应届毕业生招聘教师公告 2025年中山翠亨新区翠雅学校初中教师招聘公告(17人) 2025年怀集县卫生健康局赴高校招聘卫生专业技术人员公告(74人) 2025年南雄市中小学、 幼儿园教师招聘及选聘公告(106人) 风云A9实车抵达上海车展现场!采用1.5T插混动力 2025款丰田埃尔法PHEV来袭,豪华MPV的环保新选择? 硬派越野邂逅极致智能 抢先实拍东风猛士M817 别克子品牌“至境” “逍遥”超级融合架构发布 长城打死不做增程!为啥要跟新势力反着来? 苹果:为什么我突然在中国对iPhone 16等降价!华为等国产手机背刺 2500元良心机!骁龙8Gen3+5500mAh+120W,vivo新卷王诞生 REDMI Turbo 4海外版曝光:电池降为6000mAh! 从4699元跌至3289元,蔡司100倍变焦+天玑9300+芯片,vivo售价更亲民了 雷鸟CEO李宏伟:站在Meta肩膀上超越Meta,雷鸟V3 1799元起 Meta、苹果旗舰头显纷纷停产!价格与体验失衡是最大硬伤? 2024年中国手机市场大局已定 几家欢喜几家愁? 英伟达RTX 50系新显卡发布!AI计算又翻开了崭新一页? 那些科学家下了大功夫的美食,拼多多希望让更多人吃到 京东科技申请服务器自动化测试方法和装置专利,实现大规模服务器自动化测试 阿里巴巴:斥资3226.13万美元回购306.53万股