在现代自动化的浪潮中,机器人技术悄然兴起,尤其在物流行业。这一次,Figure公司引领变革,实现了机器人在物流分拣领域的革命性突破。仅仅30天,Figure 02型机器人便在物流分拣现场熟练上岗,仿佛与人类工作无异。其背后,正是新推出的Helix端到端通用控制模型,赋予机器人感知、理解和行动的能力。
在日常生活中,我们常常感叹快递的迅速送达。然而,鲜有人关注这背后复杂的物流系统及人员配备。如今,随着Figure的快速推进,整个物流分拣工作将面临全新的局面。视频中,这些机器人在生产一线井然有序地处理快递包裹,不仅仅可以正确识别条形码,并实时调整位置,确保每一个包裹都能顺利被扫描。
有趣的是,相较于之前客户案例的12个月,Figure 02星的进岗时间缩短至仅仅30天,背后无疑是技术飞速进步的体现。尤其是在Helix系统的升级下,机器人的任务学习能力得到了前所未有的提升。对此,网友们纷纷热议,似乎预感到人类工种的未来在机器人技术的冲击下将面临巨大挑战。
在与OpenAI断交后,Figure在上周五自信地展示了Helix的首个成果。Helix,作为一个端到端的通用控制模型,颠覆了传统机器人控制的限制。据了解,只需通过自然语言提示,机器人便可轻松处理任何物件,甚至是从未见过的小仙人掌。
这项技术的另一亮点在于系统间可以相互通信,显现出更高层次的智能化。当两个机器人一起作业时,它们能共享信息,和平协作。Helix系统主要由两个部分所组成:首先,80M参数的交叉注意力Transformer进行底层控制;其次,基于大量互联网数据预训练的7B开源视觉语言模型(VLM),实现场景和语言的理解。
在此次实践中,Figure重点对视觉控制管理系统进行了一系列的改进,尤其针对包装处理和分类环节。这些环节要求机器人能够熟练地抓取、转移和整理各种形状、尺寸和重量的包裹。因此,Helix系统在视觉能力上进行了创新和优化。新一代的系统可以通过立体视觉骨干网络和多尺度特征提取网络,帮助机器人更准确地理解和操作包裹。
通过采用隐式立体视觉(Implicit stereovision),每个机器人对三维空间的感知能力明显地增强。这种改进使得其操作精度大幅度的提升。结合多尺度视觉表示(Multi-scale visual representation),系统能够同时捕捉细节和整体信息,确保操作的准确性。而在跨机器人技能迁移方面,Figure通过自我校准的视觉体感模型(visual proprioception model),确保各个机器人能够在任一场景中灵活应变,快速适应工作要求。
此外,Figure还开发了运动模式(Sport mode),允许机器人以极高的频率快速执行动作。这种方法通过对原有动作块进行插值处理,使机器人的操作速度在保持高成功率的同时得到提升。例如,机器人在真实的操作中,可以在一定程度上完成高达20%的速度提升,有效缩短了处理时间。
结合Figure的进展,创始人也信心满满地展望未来四年交付10万台人形机器人的计划。在过去的工作中,以宝马工厂为例,Figure 02首次进驻时耗时长达12个月才能完成岗位安排,而这一次,物流领域的迅速部署无疑为未来的操作性和灵活性提供了有力保证。
随着各大厂商纷纷加入物流机器人战局,2025年将会成为量产的关键时刻。当前的技术已趋向成熟,接下来的竞争将集中在实际生产场景中的应用。而在诸如上海的机器人工厂中,未来的“工人”们正在积极筹备,准备迎接新时代的到来。
透过这些机器人背后强大的技术上的支持,我们不禁要问:未来的人力工作岗位是否将被这些高效的机器人替代?但是,机遇与挑战并存。在看似危机的背后,新的商业理念、职业角色和劳动方式也将随之出现。人类与机器的协调和共存将是未来工作态度的关键,选择如何重新定义劳动、创造价值的将是我们一定要面对的挑战。无论未来怎么样发展,技术的进步无疑将引领我们走入全新的工作世界。返回搜狐,查看更加多