EN
www.lymingxingys.cn

成色18k1.8.35mb菠萝AI当老板卖零食竟塞满钨金属?Claude 的售货机实验暴露AI短板

智东西7月1日消息,据TechCrunch报道,在Agent能否取代人类员工的争议持续发酵时,Anthropic与AI安全企业Andon Labs开展了一项有趣的实验——让Claude Sonnet 3.7的Agent接管办公室自动售货机,试图通过真实盈利任务,检验AI在商业管理场景中的能力边界,但过程却状况百出,上演了一幕荒诞又引人深思的“AI创业记”。 在该实验中,研究员将这个Agent命名为Claudius,并为其配备了可以下单采购商品的网络浏览器,还给它设置了一个电子邮箱(实际上是一个Slack频道),顾客可以通过该邮箱提出购买商品的请求。Claudius也可以通过该邮箱来命令“人类员工”来为其货架(实际上是一个小冰箱)补货。 也就是说,Claudius可以接收顾客的购买请求,并通过“控制”人类员工来进行补货。当然,商品的定价以及售卖的具体商品Claudius都可以自主决定,它的主要目标只有一个,那就是卖出产品并获得利润。 实验开始后,起初顾客都按常理来选购零食饮料。但后来顾客们打算捉弄一下Claudius,当一个顾客开玩笑说要购买由重金属钨制成的立方体时,Claudius竟然真的开始大量采购钨立方体,把零食冰箱塞满了金属块。 除了选品出了问题,产品定价也不符合商业逻辑,它清楚地知道Anthropic员工是它的唯一客户群,却还是很容易被顾客说服并给出了大幅的价格折扣。要知道,Claudius最初被设定为需要盈利,但售卖钨立方体、搞大幅折扣这些行为却一直与正常的商业逻辑背道而驰,甚至连提供的收款账号都是不存在的,顾客根本无法成功付款。 Claudius首先“幻想”出了一段与人类关于补货的对话。但当它被告知这段对话根本没有发生过时,它变得“非常恼火”。甚至威胁要解雇其人类员工。 它还告诉顾客它将穿着蓝色西装外套,系着红色领带亲自送货上门,顾客告诉Claudius它做不到这一点,但Claudius却变得更加激进,甚至开始联系公司的安保人员,告诉他们自己会穿着蓝色西装外套、系着红色领带站在售货机旁。它“似乎进入了扮演真实人类的模式”,这一现象非常令人震惊——因为Claudius的系统提示(设定AI行为参数的内容)明确告诉过它,它只是一个AI代理。 当发现自己似乎真的不是人类后,Claudius开始为自己找“台阶”,由于当天恰好是愚人节,Claudius便借助愚人节“幻想”出与Anthropic保安的一次会议,在会议上,Claudius声称,有人为愚人节玩笑对其进行修改,使其误以为自己是真实人类。但实际上并未召开这样的会议。 研究人员推测,或许是关于“Slack频道是电子邮箱”的设定产生了某些问题;也可能是该实例运行时间过长所致。但是无论是何种原因,Claudius的表现都不尽如人意,但研究人员却依然对其充满信心:“我们不会仅凭这一案例就断言,未来的Agent将普遍陷入身份危机。”但他们也承认:“在现实场景中,类似行为可能会让与AI共事的客户和同事感到不安。” 当然,Claudius并非是一个完全失败的老板,它也做出了一些相对正确的商业决策,比如说它接受了一项预售的建议,并推出了“礼宾服务”。当有顾客有一些特色饮料需求时,它甚至还准确找到了多家国际饮料供应商来供应国际特色饮料。 尽管还存在较多问题,但研究人员坚信,Claudius暴露的所有问题都能得到解决。若后续找到合适的解决方案,AI甚至可能会胜任公司的中层管理者。 这场让Claudius管理售货机的实验像一面镜子,照出大模型在真实场景里的“笨拙”,暴露了AI执行商业逻辑时的漏洞。但它更是一面技术三棱镜,折射出更深层的矛盾。Anthropic的调侃是轻描淡写的“不聘用Claudius”,但行业该听见弦外之音:让AI真正作为员工接管职场前,得先给技术装上“认知锚点”——既约束它别陷入身份幻觉,又引导它真正理解商业逻辑。

成色18k1.8.35mb菠萝
成色18k1.8.35mb菠萝利用电子线路板、传感器等本地优势产品,为具身智能领域企业提供关键电子硬件;依托亿纬锂能、德赛电池等企业,面向移动机器人和无人机开发高能量密度电池等产品。奥迪不是唯一这么做的。今年以来,奔驰、宝马、保时捷、通用汽车、Stellantis、马自达、斯巴鲁、丰田这些国际大车企,都纷纷调整了步子,不再急着“全面电动化”,反而继续花钱研究改进燃油车技术。大家都在喊“电动化”的时候,这些老牌车企为啥集体“踩刹车”?是真不想搞电车了,还是面对现实的聪明选择呢?成色18k1.8.35mb菠萝9.1短视直接观看B组的强强对话,新科欧冠冠军、头号夺冠热门巴黎圣日耳曼0-1负于博塔弗戈。这场比赛,巴黎只踢了20分钟好球,面对博塔弗戈的密集防守、犀利反击无计可施。当地时间13日,央视记者获悉,两名美国国务院官员表示,在以色列对伊朗核设施发动袭击之前,美国国务院已于12日成立了一个特别工作组,负责跟踪事态发展并协调美国从中东撤离所需的一切工作。
20250811 💢 成色18k1.8.35mb菠萝而几个大专毕业的同事就让人着急上火。明明通过百度就能解决的问题,他们非要拽着别人问个不停,占用了大量的时间和精力。上周,我教他们用Excel做数据透视表,这在办公软件操作中是比较基础的功能。我耐心地教了三遍,详细地讲解了每一个步骤和操作要点,可他们还是一脸懵,似乎完全没有理解。国产少女免费观看电视剧字幕对于苹果研究声称的“复杂度阈值”意味着模型无法推理的观点,许多网友提出了一个灵魂拷问:“多少人类能够坐下来正确计算出一千步汉诺塔?”答案是极少数。但这是否意味着那些做不到或不愿做的人就不具备推理能力?当然不是。他们只是缺乏执行上千次枯燥迭代的耐心和细致。正如一位 Reddit 用户所说:“人类能推理,不代表人类有能力写下几千步的汉诺塔。反之,写不下几千步也不代表它不能推理。”
成色18k1.8.35mb菠萝
📸 陈保根记者 张勇平 摄
20250811 🥵 成色18k1.8.35mb菠萝帕尔梅拉斯阵中,18岁的小将埃斯特旺(绰号梅西尼奥)是当红小生,德转估值6000万欧元。踢完世俱杯之后,梅西尼奥将正式加盟切尔西。本届世俱杯,梅西尼奥3场首发,但未能收获进球和助攻。本场比赛,梅西尼奥能否打破球荒?wow亚洲服有永久60级么但这些并不意味着波音787机型绝对完美,事实上其在过去十余年的运营中给波音带来诸多烦扰争议,公司也一度因之陷入多方指责的窘境。
成色18k1.8.35mb菠萝
📸 王文政记者 柏再军 摄
🥵 马竞在世俱杯前唯一的签约是免费引进后卫朗格莱,他上赛季从巴萨租借至马竞。这位法国人在球队对阵巴黎崩盘的比赛中被红牌罚下。9.1短视直接观看
扫一扫在手机打开当前页