在乌镇,“大模型”成为“高频热词”
“文心智能体技术,受到人脑快思考慢思考的启发,在基础大模型之上研制了基于思考模型的慢思考机制,更理性、更准确。”
“Angel大规模机器学习平台在规模方面采用了GPU拓扑感知调度,研发了层次化规约计算,实现了单任务万卡的线性扩展。”
“‘认知决策智能体技术创新及应用’项目通过图智能、运筹优化等技术突破,实现了基于万亿级关联关系、行业知识和专家经验的实时推理决策。”
……
在11月19日下午举行的2024年世界互联网大会领先科技奖颁奖典礼现场,“大模型”多次出现,成为“高频热词”。
2024年世界互联网大会领先科技奖颁奖典礼现场。光明网记者 潘迪 摄/光明图片
自ChatGPT发布后,以大模型为代表的人工智能技术正在引领科技创新和产业变革浪潮。如果说普通观众是“看热闹”的直观感受,那么大模型的研究者和从业者,则更关心这条新赛道上更深层次的“门道”。
大模型时代,模型参数超过万亿,训练数据超过十万亿,如此庞大的规模,给模型训练和推理带来三个关键挑战,即通信挑战,如何实现大规模AI算力节点的高速互联;效率挑战,如何实现高效的训练性能和推理速度;规模挑战,如何实现万卡甚至更大规模集群的线性扩展。
对此,腾讯公司副总裁蒋杰表示,“Angel大规模机器学习平台关键技术与应用”项目,通过自研RDMA网络、显存+主存一体化机制及GPU拓扑感知调度等技术,实现了通信、效率与规模的全面优化,为大规模机器学习模型的训练和推理提供了强有力的支撑。
“截至今年9月,Copilot已搭载了GPT-4o等领先模型,集成了多项创新功能。例如AI时代的开创性数字工具Copilot Pages,与数据中枢BizChat无缝集成,将网页数据、工作数据和业务数据整合到用户的工作流中,构建出全新的多用户实时、持续的AI协作模式。”微软全球资深副总裁张祺介绍,诸多独特优势,使Copilot不同于其他AI服务,开创了以AI为思维引擎的全新工作模式。
然而,技术的革新并未止步。百度公司发布的文心智能体技术,则是对人工智能模仿人类思考能力的深度探索。百度公司首席技术官王海峰介绍,文心智能体基于思考模型的慢思考机制,通过思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习等思考增强训练,实现了从“模仿”到“思考”的跨越。
这一突破,不仅提升了文心大模型的能力,充分释放其潜力,更加速了应用的爆发:代码智能体、农民院士智能体、个人助手等“遍地开花”……据了解,截至目前,文心智能体已凝聚超过80万开发者、15万家企业。
技术的创新,最终要真正实现“落地”,才能发挥其价值。在蚂蚁科技集团股份有限公司首席技术官何征宇看来,新一代人工智能技术在大规模落地中,面临领域认知能力弱、复杂推理能力差、端到端落地难三大挑战。此次发布的“认知决策智能体技术创新与应用”项目,正是将人工智能技术深度融入产业实践的生动例证。
该项目通过研发万亿参数的可信大模型基座、高性能知识决策引擎及行业智能体开发平台,实现了人工智能在医疗、民生、金融等领域的广泛应用,显著提升了行业的认知力和行动力。
回顾过去,人工智能大模型产业的发展已经取得了令人瞩目的成就;展望未来,智能化浪潮势不可挡,人工智能将深刻改变我们的生活和工作方式。
在此过程中,我们也应清醒的认识到,人工智能技术的发展仍面临数据安全、隐私保护、伦理道德等诸多挑战和问题,如何平衡好技术创新与社会责任的关系,确保人工智能技术的健康、可持续发展,亟待解决。
“独木不成林,单弦难成曲。”人工智能大模型产业的发展离不开社会各界的共同努力。我们相信,在科技巨头的引领下,在广大开发者和企业的积极参与下,人工智能大模型产业将迎来更加广阔的发展前景,向着“以人为本、智能向善”聚力前行。