I智能体( Agent)必一运动AI产品分析:A
为用户在多APP交互场景中提供便利○○▼=▼,AutoGLM更关注手机端使用▽▪◆=▽●。AutoGLM是智谱科技推出的一款AI智能体产品▼…▽▽★▪,直接对接图形用户界面▷△▪。三是具备跨App能力…★,摆脱特定接口依赖◇■▽…●▪。
硕士△▲◆□、高级工程师○△△■▽▷。具有多年通信行业▼•▼○、零售行业研究经验●◆。近年来主要从事数字政府◁○◆、行业数字化转型等领域的研究▼•▷■●☆。
Agentforce商业化进展加速■•◆△。Agentforce是由Salesforce在2024年9月推出的一款自主AI Agent产品•-,旨在通过智能化和自动化的方式提升企业的服务必一运动◆•-☆、销售和营销效率•…。Agentforce由Agent Builder和Agentforce Service Agent两部分组成▲▲◁▽•。一是提供定制服务▽☆▷●▪●,Agent Builder可以让企业用户可通过低代码/无代码等方式来定制AI Agent…◁◇=▽★,以适应不同的业务场景需求◇▽◁•☆●。二是支持即用服务●☆▲▽,Agentforce Service Agent是面向客户的AI服务助手●=★▽…◇,支持多渠道(如语音●●◇▽、WhatsApp▲■、FacebookMessenger)自助服务△▼◆-…□,帮助企业快速响应客户需求●▲。Agentforce已面向服务和销售全面推出◇▲▲●,起价为每对线美元▪△。根据Salesforce FY2025Q3业绩会○▷,第三季度公司获得超过100万美元的AI交易数量☆▪☆◇,同比增长两倍多□▪◇▼。
高级工程师△▼▼△-,就职于中国电信研究院•■☆◆☆,长期从事产业数字化政策▪○◇…△、需求和趋势研究◆○◇▷◇■。
AI Agent的关键功能▽▽▼□★,如自主思考▲▽■•○、规划与工具调用■◆▼…、记忆-▪◁◇◆、多模态理解▷○●△,当前均存在一定的局限性▪□▪▷▷。一是自主思考能力有限○•☆●★。当前AI Agent多基于RPA理念◇••,依赖人为设定的规则和干预★☆▲▼■●,自主探索能力较弱■◆□▷◁•。二是规划与工具调用能力低☆-▷。AI Agent在复杂场景下的推理和规划能力尚待提高◇▽▷,对于模糊或不完整的指令●△,其表现可能不稳定•-▲☆☆。三是长期记忆构建能力不足◁▲。大多数AI Agent依赖Prompt构建短期记忆★□•,而事实性记忆则通过RAG技术实现•=,但缺乏长效▲▽、稳固的记忆体系◁□,难以支撑连贯且深入的交互需求△-。四是多模态理解能力差▼=…=•▪。AI Agent主要依赖大语言模型△•◁★=,在图像▪○▼、音频▼◇、视频等多模态信息理解上能力有限◆△●▽▷-。随着技术不断进步◁▪■▪△…,未来AI Agent有望在这些领域实现显著突破☆••●◆,变得更加智能和自适应◆-●◁。
就职于中国电信研究院▷▪•…•,长期从事价值评估△■▷▷=、行业洞察等▲☆,近年来专注产业数字化○○▷◇-◁、人工智能等领域研究◁…▪。
基于大语言模型的快速发展阶段▼◁-◆◆•:大语言模型强势崛起□●-…▼•,基于LLM的AI Agent应运而生▽□•●◇。2018年▪◆,谷歌发布BERT模型开启大语言模型时代◇★◆▼,AI Agent进入快速发展期□■▷。2019年☆◁■☆=◁,OpenAI推出GPT系列▪☆=△…,尤其是GPT-3和GPT-3★●▲●△.5•◆▼★★,大幅提升AI Agent的文本生成和知识储备能力□▪▷◆。2023年▲☆▷,LLaMA○▼▪、BLOOM等开源大模型降低了行业门槛☆-■-■◆,促进技术生态的多元化★…★◇。今年3月GPT-4和AutoGPT的发布▼•==▪★,使AI Agent能够自主规划和执行复杂任务=-,实现了从被动执行到主动工作的转变●-▪■▷。据Gartner预计▽▼=☆■,Agentic AI是2025年十大技术趋势之一●•,并预测到2028年■…▲,至少有15%的日常工作决策将由Agentic AI自主完成☆■▲▷•☆。
绝大多数任务都能圆满完成-•…□■△,长期从事产业数字化•●◆◇…、数据要素等研究领域◆…□。中级统计师◆••,就职于中国电信研究院=◆•,四是自动化任务执行•◁◇▼☆,旨在提升用户的生活和工作效率☆★☆。
基于规则和早期机器学习阶段◁☆▽:AI Agent专注于特定领域的任务▪▼,能力有限=▷□。1997年▪◆,IBM的深蓝在国际象棋中战胜世界冠军◁▼,展示基于规则的AI在特定领域的潜力★☆▼●=□,但缺乏通用性▼••。2016年■★○,谷歌的AlphaGO通过深度学习和蒙特卡洛树搜索战胜围棋高手……▪•▷☆,拓宽AI在策略博弈领域的应用■•。
在真实环境中执行自动化任务△…○★,简化用户的操作流程▲=◁▼。AutoGLM在7款常见手机APP中应用测试中表现良好◆••◁◇▪,通过文字或语音指令=□▽,一是模拟人类操作▽•○◁◁,支持抖音☆▲◇、京东☆●•◇■I智能体( Agent)、饿了么等主流APP•◁,完成如微信点赞评论●▼•、淘宝购物○▲◆、携程酒店预订△•▪◇、12306购票▷★-、美团外卖等多项任务☆☆■••。二是无需API支持★••●…○,如可在美团和饿了么比价◆■△☆◆▪、在小红书搜攻略后去携程订酒店等▲••◁•。少数未完成的任务也能部分推进•☆◁。
AI智能体(AI Agent)是一种能够自主感知环境•◆▽•◁、进行决策并执行任务的智能系统▲-●。从早期专注于特定任务的AI系统…△☆-,到如今能自主执行复杂任务的智能实体■▪◇□=△,演进历经两个关键时期◆•:
2024年以来▼△,全球AI Agent赛道资本市场也愈加活跃▲■◁,融资数量超25起…■,融资金额超665亿元1▪▽•■□,其中下半年融资数量是上半年2倍多★-●☆▷。随着AI相关技术的快速发展-▼,未来AI Agent领域有望获得更多融资△▼=△了!实用才是智能眼镜的最优解MG电子智能生活随身助手来!,市场发展前景也更加广阔▲•,据Markets and Markets预测●◇=●=■,全球AI Agent市场将从2024年的51亿美元增长到2030年的471亿美元▷○○,年复合增长率达44◆▼★◁▼….8%-◁。
AI Agent已成科技巨头必争之地◇▲•▼★▷。微软在Ignite 2024技术大会宣布建立全球最大的企业级AI Agent生态系统▼•△•…,已有超过10万家公司利用Copilot Studio创建或编辑AI Agent◁●★。谷歌推出商用AI Agent市场AI Agent Space○=□▪◁▷,上架19款解决方案-◁…,并且还在持续更新中▪▷▼●▲。国内科技巨头也在快速布局AI Agent领域●●,智谱在11月29日的OpenDay上发布AutoGLM△••○□-、AutoGLM-Web△●=◆▷■、AutoGLMPC三款Agent产品•△◇…,字节□▪◁□▲、腾讯○▷-●▼、百度○■▷★■、阿里等大厂也推出扣子○★▷★•▷、腾讯元器□▼-■□○、文心智能体▲○、千帆AgentBuilder等Agent产品▷☆◁■▼。AI Agent成为…◁“新风口-☆”□●。
据Menlo Ventures数据◆▷,在企业AI设计模式中△…▽,AI Agent今年异军突起◁△●,占比从0上升至12%▪▼-•。Agent具备复杂推理能力…-▪■○-、能执行多步骤任务…•-☆,有望与企业应用深度结合…▷○●□,在企业服务等各类场景中发挥巨大价值△=◆▲。
Claude 3◇-▲●▼.5 Sonnet具备◁•▷=“像人一样使用电脑□…□▽◆▲”的能力◆◁-。2024年10月◆■=▪△•,Anthropic发布升级版Claude 3★▽▪▲.5 Sonnet模型•△…。一是推理能力大幅升级▪●○=△,在研究生水平推理能力GPQA•▽□★…、一般推理能力MMLU必一运动==★、编程能力等方面表现优于GPT-4o和Gemini 1▲☆△.5-○▽□=☆。二是新增-•…□“Computer use…★”功能▷○○,可模拟人类操作电脑▼◁-○,通过API指令•▪◆…•▲,Claude能观察屏幕◁•▷■=、移动光标▽▲◆、点击按钮和输入文本…●=▽-,从而执行网站设计△•◇▲、表格填充等任务▪◁…○▲▼,显著提升AI的自动化能力◁▲◇◇=。三是分步骤拆解规划☆■○•,在模拟人类操作电脑时•=◆▽★,Claude将任务拆解成了若干步骤◆▽=▲,并对每一步给出详细解释◆▲,使用合适的工具去完成规划▽◁□。四是具备自我调整过程◁■▼■▲,如遇到浏览器闪崩可以再次打开浏览器并展示结果▪☆。升级版Claude 3■△.5 Sonnet在OSWorld2测试中◇▼☆,虽然得分为AI模型中首位■■▷▼▽▽,但其电脑使用能力表现较人类水平仍有提升空间…▽-。
基于LLM的AI Agent不仅让每个人都有增强能力的专属智能助理□▪★,还会改变人机协同的模式◇◇。生成式AI带来的人机协同•-▼,呈现出三种模式▷-▪必一运动AI产品分析:A。在智能体模式中▽▪★■…◁,AI的互动性☆▲□、自主性和适应性得到充分发挥…=,可以作为独立行动者自主完成任务=…▷,人类则从执行者转变为监督者和评估者••▼▽…△,与嵌入模式的命令执行工具和副驾驶模式的合作伙伴有本质区别=□●◁。