投资数据范畴AI创企以撑持AI研发
投资数据范畴AI创企以撑持AI研发。2024年5月,Meta、英伟达、亚马逊、英特尔AMD等公司配合投资数据效劳AI草创公司Scale AI。据Scale AI官网显现,本次共筹集10亿美圆,融资后公司估值为138亿美圆。Scale AI是一家供给数据标注效劳的公司,还能为客户创立和完美数据集。Meta此次投资Scale AI,将以本钱为纽带与其成立不变协作干系,扩大本人在AI根底设备的规划,更好支持公司展开AI立异研发。
改良Ray-Ban Meta智能眼镜,连续扩大多模态功用。2021年9月,Meta协作雷朋公布初代智能眼镜Ray-Ban Stories,2023年9月公布二代产物Ray-Ban Meta。2024年4月,Meta为Ray-Ban智能眼镜参加新AI功用,用户经由过程说出“Hey Meta”并提出指令、成绩,激活眼镜内置的AI助手,除施行常见问答操纵外,更新后的智能眼镜能够挪用摄像头拍下用户当前正在看到的场景,挪用多模态大模子才能,以完成更多视觉化操纵。2024年9月,在Meta Connect大会,Meta颁布发表Ray-Ban智能眼镜将迎来一系列提拔智能化体验的软件晋级,新功用包罗:(1)经由过程眼镜记着用户看到的事物,并撑持设置提示、调取响应信息等;(2)许可经由过程眼镜扫描二维码、拨打电线)及时视频处置幼儿园食谱创意宣扬,经由过程眼镜及时了解四周情况。
2024年第三季度功绩超预期增加。2024年10月30日,Meta公司公布2024财年第三季度财报,财报显现,Meta第三季度营收为405.89亿美圆,超越华尔街阐发师估计的402.5亿美圆,与客岁同期的341.46亿美圆比拟增加18.87%,与第二季度的390.71亿美圆比拟增加3.89%;净利润为156.88亿美圆,与客岁同期的115.83亿美圆比拟增加35.44%,与第二季度的134.65亿美圆比拟增加16.51%。Meta估计第四时度营收将到达450-480亿美圆,支出瞻望高于市场预期。
以Llama为中心的开源AI生态愈发繁华,Meta AI无望成为环球利用率最高的AI助手。模子方面,以Llama系列模子为中心的生态圈愈发强大,衍生出浩瀚变体模子。Meta官方颁布发表,停止2024年9月1日,Llama系列模子在Hugging Face上的下载量已靠近3.5亿次;据天翼智库团队统计,停止2024年10月27日,Llama 3.2系列模子Hugging Face下载量超487万次,其微调模子超2400个;Llama 3.1系列模子Hugging Face下载量超2200万次,其微调模子超6900个。产物方面,在三季度财报德律风集会上,扎克伯格暗示Meta AI的月活泼用户已超5亿,无望在年末前成为环球利用率最高的AI助手。
注:1)数据源于Meta公司财报、公然材料;2)“当行进展”列中财政数据为公司2024Q3财政表示;3)除出格正文外,“变革幅度”列中定质变化指环比,定性变革指公司近半年停顿比照上一阶段(停止到天翼智库团队所做第一轮企业对标)的明显变革;4)白色向上箭头暗示增长,绿色向下箭头暗示削减。
Meta AI深度赋能智能眼镜,拉动智能硬件出货量。在二季度财报德律风集会上,Meta暗示AI驱动着Ray-Ban Meta智能眼镜比预期更快获得胜利,当前市场求过于供,公司方案2025年推出Llama 4,更新模子后Meta AI赋能的智能眼镜销量无望迎来快速增加。按照IDC统计数据,Ray-Ban Meta在2023Q4、2024Q1的出货量别离是36万副、10万副;按照国金证券等预算,Ray-Ban Meta在2024Q2出货量超50万副,估计2024整年出货量将超越150万副幼儿园食谱创意宣扬。
开源SAM 2,解锁视频朋分才能。2024年7月Meta开源SAM 2,SAM 2为静态图象和静态视频内容供给及时、可提醒的工具朋分,并将图象和视频朋分功用同一到一个别系中。模子功用表示方面,SAM 2可以朋分任何视频或图象中的任何工具,以至是模子从前没见过的工具和视觉域,无需自界说调解;SAM 2在图象朋分精确性方面逾越以往才能,在视频朋分机能方面优于现有功效,且所需交互工夫是本来的1/3。
连续加大本钱收入以支持AI营业久远开展。Meta季度财报显现,公司三季度本钱收入为92亿美圆,环比增加8.62%,同比增加36.09%。Meta估计2024财年本钱收入将在380-400亿美圆之间,比拟二季度预期的370-400亿美圆有所上调,次要用于效劳器、数据中间和收集根底设备的投资,连续撑持AI研讨和产物开辟事情。
促进模子完成多言语撑持,扩大产物可用国度和地域。模子方面,Meta的Llama 3.1系列模子完成多言语撑持,由英语扩大至撑持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语共8种言语,鞭策基于Llama系列模子的产物触达更多用户。产物方面,2024年4月幼儿园食谱创意宣扬,Meta颁布发表将基于Llama 3的Meta AI的效劳范畴扩大至美国以外的13个国度和地域,包罗澳大利亚、加拿大等。公布Llama 3.1后,Meta颁布发表Meta AI已在超20个国度和地域可用,新参加的国度和地域包罗阿根廷、智利等。2024年9月,在Meta Connect大会上,Meta颁布发表Meta AI新语音功用将在美国、加拿大、澳大利亚等多地推出。2024年10月,扎克伯格暗示,Meta AI再增巴西、英国等6个可用国度和地域,以后将逐渐推行,使可用国度和地域扩大至43个甚么叫带量食谱,方案新增阿尔及利亚、埃及等,Meta AI也将撑持超12种言语,新增对阿拉伯语、印尼语、泰语和越南语的撑持。
打造Meta AI,努力于成为最智能的AI助手。2024年4月,Meta推出基于Llama 3构建的Meta AI,将其嵌入自有APP生态中,包罗Facebook、Instagram、WhatsApp和Messenger使用法式,Meta AI次要在谈天、搜刮、总结等需求中利用幼儿园食谱创意宣扬,撑持会见及时信息、天生图片。2024年9月,在Meta Connect大会上,Meta颁布发表晋级Meta AI,用户可间接用语音而非笔墨与其互动。别的,新版Meta AI将在美国推出图象功用,能为用户供给图片反应和信息,如报告用户图片中鸟的品种;协助用户编纂图片,如基于用户需求为图片增加布景或细节;许可用户在谈天中及时编纂图片,如移除工具、增加帽子等。
大连理工大学硕士,就任于中国电信研讨院,专注于野生智能、产业互联网等范畴手艺及财产研讨事情。
对峙开源道路,模子触达环球开辟者、研讨职员。Meta对峙开源战略,较早参加大模子开源阵营甚么叫带量食谱,于2023年2月在Hugging Face、GitHub等环球出名开源社区公布Llama模子,疾速成为开源社区中最受欢送的大模子之一,尔后连续迭代并开源在普遍基准测试中到达开源最高水准的Llama系列模子。Meta鞭策Llama系列大模子开源,使环球范畴内的开辟者、研讨职员等能基于本身需求调解、优化模子,极大低落大模子利用门坎,鞭策环球范畴内对AI手艺的普遍接纳和立异。
看到AI为XR硬件带来减色,Meta重组Reality Labs。2024年6月,Meta颁布发表对卖力元宇宙和假造理想营业的Reality Labs团队停止严重重组,将其拆分为元宇宙和可穿着装备两个营业部分,元宇宙部分将次要卖力Quest头显产物线、Horizon和相干手艺的研发与立异,可穿着装备部分将专注于Ray-Ban Meta智能眼镜等多元化硬件的研发,寻觅合适可穿着Meta AI的壮大产物市场。业界阐发,正如Meta在发给员工的内部备忘录中提到的那样,“Ray-Ban Meta智能眼镜比Meta预期要胜利很多”,这款智能眼镜的销量让Meta看到AI给XR硬件带来的减色,因而快速将其塞入Reality Labs的建制中,期望能借助AI新硬件的研发改变部分吃亏近况。
Meta功绩超预期增加,2024Q3净利润环比高增16.51%;Llama系列开源模子初次向多模态、轻量化开展;重点促进大模子赋能可穿着装备,拉动Ray-Ban Meta智能眼镜2024Q2销量环比猛增400%,新公布Orion AR眼镜入局AI+AR眼镜赛道。
开源Llama 3.1,机能追平抢先闭源模子。2024年7月23日,Meta开源Llama 3.1系列模子,共有8B、70B和405B三个版本。Meta在超150个基准数据集上评价模子机能,Llama 3.1 405B在知识、数学、多言语翻译等一系列使命中,表示追平以至逾越GPT-4o、Claude 3.5 Sonnet等抢先闭源模子,成为开源AI范畴的主要里程碑。模子才能方面,Llama 3.1系列模子的高低文窗口达128k,供给多言语撑持,可集成搜刮引擎API以撑持联网检索,撑持挪用多个东西完成使命,如天生并施行Python代码来绘制图表。
2024年10月,Meta推出AI视频音频天生模子Movie Gen,能按照文本提醒天生和编纂视频,为视频配上同步音频。Movie Gen次要功用包罗:按照用户文本提醒天生16秒高清视频;操纵用户上传图片天生特定视频内容;撑持用户经由过程文本指令对视频停止准确编纂;按照文本提醒天生与视频内容相婚配的高质量音频。Meta今朝仅宣布Movie Gen的论文和视频展现,暂未对外开放利用。
开源Segment Anything Model(以下简称SAM),计较机视觉范畴首个用于图象朋分的通用大模子。2023年4月,Meta在GitHub上开源SAM模子,SAM接纳Transformer架构,是计较机视觉范畴公布的第一个用于图象朋分的、可经由过程提醒语(prompt)方法使用的通用大模子。
2024年7月,Meta在研讨论文中提出文生3D模子Meta 3D Gen,可以在不到1分钟的工夫内从文本间接端到端天生高质量3D资产,天生内容纹理明晰、形状传神天然,且天生速率比其他替换计划快3-60倍。今朝Meta 3D Gen并未开放试用API及响应代码,Meta也未流露详细公布工夫。
2024年5月,Meta的野生智能研讨团队公布图文混淆多模态开源模子Chameleon(变色龙),可无缝处置文本和图象,天生多模态内容。手艺立异方面甚么叫带量食谱,Chameleon接纳晚期交融架构,经由过程图象分词器对图象停止离散“分词化”(Tokenization),将差别模态的信息在输入阶段就映照到统一个暗示空间中,使得模子可无缝处置文本和图象。机能表示方面,Chameleon在纯文本使命中机能与Gemini-Pro相称,在视觉问答和图象标注使命中革新SOTA(State of the Art),机能靠近GPT-4V。
充实阐扬大模子赋能感化,前向放大交际平台代价,后向提拔告白效劳,依托告白完成贸易变现。告白营业是Meta最中心的支出滥觞,三季度报显现,Meta告白营业表示优良,支出达398.85亿美圆,环比增加4.06%,占三季度总支出的98.27%。大模子从两方面发力,助力告白营业增加。一方面,Meta AI提拔交际平台用户粘性,为告白变现夯适用户根底。自2023年9月推出以来,Meta AI疾速融入Meta的使用家属生态,以AI谈天机械人的情势赋能社群,丰硕社区内容供应、提拔用户交互体验,助力提拔用户活泼度。据三季度财报,停止2024年9月,Meta使用家属日活泼用户(DAP)均匀值为32.9亿人,同比增加5%。另外一方面,大模子提拔告白营业服从,吸收更多告白商。Meta将大模子深化规划于告白天生与投放中,基于大模子天生内容激起告白创意、进步创作服从;基于大模子精准猜测并推送与用户爱好和需求高度符合的告白内容,增长告白点击率与转化率。三季度报显现,停止2024年9月,在使用家属中投放的告白展现次数同比增加7%,每条告白的均匀价钱同比增加11%。
公布Orion AR眼镜,或成为环球最强AR眼镜。2024年9月,在Meta Connect大会,Meta公布首款AR眼镜Orion。Meta在会上展现Orion的两个AI场景,一个是经由过程笔墨天生图片;另外一个为是经由过程眼镜间接辨认场景中的物体,并停止剖析。如利用Orion快速辨认桌上所放食材,基于食材天生合适菜谱,并供给停止摒挡的一切步调教程。Meta暗示,Orion是一款面向消耗者打造的产物,但今朝仍是原型机,只面向部门隔辟者和体验职员供给。
推出AI Studio,撑持用户零编程创立、分享本性化AI脚色。2024年7月,Meta推出基于Llama 3.1模子的AI Studio平台。用户无需具有编程常识,便可基于平台轻松创立AI脚色,自界说AI脚色的姓名、本性、语气等,并在Instagram、Messenger等平台将定制AI脚色分享给粉丝或密友。AI Studio将协助企业提拔客户效劳服从和客户合意度,赋能创作者进步与粉丝互动服从、增长粉丝粘性,为一般用户增加与密友互动新兴趣。
对峙产学研片面协同,连续扩大多元协作同伴。(1)连续促进与天下顶尖院校协作,展开大模子枢纽中心手艺攻关。2024年10月,Meta野生智能研讨院(FAIR)结合加利福尼亚大学伯克利分校和纽约大学的研讨职员提出一种新办法,经由过程迭代搜刮和优化,让模子在没有分外人类数据的状况下进修怎样考虑。(2)连续扩大硬件供给商同伴,促进Llama系列大模子高效运转。Llama 3.2系列模子自觉布首日便撑持高通和联发科硬件,并针对Arm处置器停止优化;Llama 3.2系列模子与英伟达加快计较平台搭配利用,为开辟者、研讨者和企业供给新功用和优化加快;Meta联袂英特尔优化并加快Llama 3.1模子,确保模子在差别情况下高效运转。(3)连续扩大云商协作同伴,撑持开辟者在更多云平台停止模子开辟。Meta公布LIama 3.1和LIama 3.2后,撑持模子在AWS、MicrosoftAzure、GoogleCloud、OracleCloud等协作平台上开辟。(4)连续扩大手艺供给商同伴,简化开辟者停止模子布置。Llama 3.2公布之际,Meta初次公布官方Llama Stack API,由Meta与Databricks、Fireworks、Infosys和Together AI同等伴协作构建,简化开辟者在单节点、当地、云端和装备等差别情况中的布置,撑持加强检索天生(RAG)和宁静东西集成。
开源Llama 3.2,向多模态、轻量化开展。2024年9月26日,在Meta 2024年度开辟者大会上,Meta开源Llama 3.2系列模子,包罗11B、90B两其中等范围的视觉狂言语模子,和1B、3B两个轻量级的文本模子。Llama 3.2 11B和90B视觉模子能处置图象了解使命,包罗文档级的图表了解幼儿园食谱创意宣扬、图象形貌等,在视觉了解使命上表示可媲美Claude 3 Haiku、GPT-4o mini等抢先闭源模子。Llama 3.2 1B和3B模子专为挪动和边沿装备设想,撑持128k tokens的高低文处置。Llama 3.2 3B在遵照指令、择要总结、快速重写等使命上表示优于Gemma 2 2.6B、Phi 3.5-mini等模子,Llama 3.2 1B的表示媲美Gemma。10月24日,Meta推出Llama 3.2 1B和3B模子的量化版(QLoRA及SpinQuant版),量化后模子巨细均匀削减56%,RAM(随机存取存储器)利用量均匀削减41%,模子速率进步2至4倍,同时低落功耗。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186