AI在操作系统里复制了自己 这一天还是来了...(组图)
新闻来源: 量子位 于2024-01-15 11:34:05 提示:新闻观点不代表本网立场
这一天还是来了,AI在操作系统里启动了一个自己的副本。![](https://web.popo8.com/202401/15/16/12f6ceee40type_png_size_1080_283_end.jpg)
往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任务。
往大了说,也可以算是“AI复制自己”的雏形了。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-twdt4qpehh/da86c47106fa461a8d71df597690f68e~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1705944544&x-signature=OYrmRGTD9eVkdIphc6pY9u6aICw%3D)
(别被作者的蓝天白云壁纸骗到了,这其实是MacOS)
从AI这一顿眼花缭乱的操作中可以看出,核心是多模态大模型,通过截图判断屏幕上正在发生什么,生成下一步操作的计划,调用系统接口执行之后再次截图。
![](https://web.popo8.com/202401/15/11/90400d2fa8type_png_size_1024_138_end.jpg)
要按网友建议加上语音识别功能,真就能模拟钢铁侠的贾维斯了。
![](https://web.popo8.com/202401/15/1/458dfe94fdtype_png_size_1080_181_end.jpg)
AI能不能复制自己,是OpenAI内部始终关注的安全测试内容之一。但GPT-4出道至今,这项测试结果一直没有公布。
![](https://web.popo8.com/202401/15/3/91ae4f9d04type_png_size_1080_480_end.jpg)
如今,先不管模型本身有没有这个能力,接入GPT4V的开源项目已经可以做到了。
AI与操作系统结合这个开源项目叫做Open Interpreter,GitHub热榜常客,半年时间已积攒3.7万星。
![](https://web.popo8.com/202401/15/14/6e5bc97ff4type_png_size_1080_360_end.jpg)
从名字也可以看出,最早只是一个ChatGPT代码解释器的开源升级版。
与OpenAI官方版相比,没有3小时50条对话的限制,以及可以连接网络、可以自定义预安装的Python包等等好处。
发布不久后初代作者Killian Lucas就想到,为什么一定要在虚拟沙箱环境执行代码?直接让AI接入真实系统有更大的可能性。
于是,第二个大版本就是操作系统级AI Agent了。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-twdt4qpehh/f76fc30353bf403b9ddb43c72c01afac~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1705944544&x-signature=khgkxMXkqIlhKahaXFPGf6o4McE%3D)
Open Interpreter最近更新了第三个大版本,其中接入的大模型改为多模态版本。
![](https://web.popo8.com/202401/15/12/a8c6295594type_png_size_1080_107_end.jpg)
核心贡献者Ty Fiero展示了AI自动发送邮件。
![](https://web.popo8.com/202401/15/13/c0af808f28type_png_size_1080_109_end.jpg)
以及更复杂的AI操作专业编曲软件作曲。
![](https://web.popo8.com/202401/15/10/47207311c7type_png_size_1080_117_end.jpg)
团队在这个版本设计了全新的Computer API,并且与原本的Open Interpreter分离,可以独立运作。
![](https://web.popo8.com/202401/15/2/e3438b53c2type_png_size_1080_62_end.jpg)
在新版本更新文档中,可以看出团队更大的野心:着手开发AI时代新的计算机架构,也就是语言模型计算机LMC(Language Model Computer)。
![](https://web.popo8.com/202401/15/7/f5018c06detype_png_size_1080_117_end.jpg)
Kilian借助CES上199元的AI掌机Rabbit R1爆火的机会公开招募开发者加入,打算快速复刻一个开源版本,硬件成本不到50美元。
![](https://web.popo8.com/202401/15/4/b0c6ff84c0type_png_size_1080_67_end.jpg)
不到48小时,就有超过200位工程师和设计师愿意加入这个项目,评论区中还不断有人继续申请中。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-twdt4qpehh/adb7f544ef7d4ef3807659dbcf8a0269~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1705944544&x-signature=FGMLC6Vpph7Sbkvzl46moiIgMRg%3D)
不知道这个团队回复大量应聘邮件和私信,用的是不是AI。
参考链接:
[1]https://twitter.com/fieroty/status/1746639975234560101
[2]https://github.com/KillianLucas/open-interpreter
![](https://web.popo8.com/202401/15/16/12f6ceee40type_png_size_1080_283_end.jpg)
往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任务。
往大了说,也可以算是“AI复制自己”的雏形了。
(别被作者的蓝天白云壁纸骗到了,这其实是MacOS)
从AI这一顿眼花缭乱的操作中可以看出,核心是多模态大模型,通过截图判断屏幕上正在发生什么,生成下一步操作的计划,调用系统接口执行之后再次截图。
![](https://web.popo8.com/202401/15/11/90400d2fa8type_png_size_1024_138_end.jpg)
要按网友建议加上语音识别功能,真就能模拟钢铁侠的贾维斯了。
![](https://web.popo8.com/202401/15/1/458dfe94fdtype_png_size_1080_181_end.jpg)
AI能不能复制自己,是OpenAI内部始终关注的安全测试内容之一。但GPT-4出道至今,这项测试结果一直没有公布。
![](https://web.popo8.com/202401/15/3/91ae4f9d04type_png_size_1080_480_end.jpg)
如今,先不管模型本身有没有这个能力,接入GPT4V的开源项目已经可以做到了。
AI与操作系统结合这个开源项目叫做Open Interpreter,GitHub热榜常客,半年时间已积攒3.7万星。
![](https://web.popo8.com/202401/15/14/6e5bc97ff4type_png_size_1080_360_end.jpg)
从名字也可以看出,最早只是一个ChatGPT代码解释器的开源升级版。
与OpenAI官方版相比,没有3小时50条对话的限制,以及可以连接网络、可以自定义预安装的Python包等等好处。
发布不久后初代作者Killian Lucas就想到,为什么一定要在虚拟沙箱环境执行代码?直接让AI接入真实系统有更大的可能性。
于是,第二个大版本就是操作系统级AI Agent了。
Open Interpreter最近更新了第三个大版本,其中接入的大模型改为多模态版本。
![](https://web.popo8.com/202401/15/12/a8c6295594type_png_size_1080_107_end.jpg)
核心贡献者Ty Fiero展示了AI自动发送邮件。
![](https://web.popo8.com/202401/15/13/c0af808f28type_png_size_1080_109_end.jpg)
以及更复杂的AI操作专业编曲软件作曲。
![](https://web.popo8.com/202401/15/10/47207311c7type_png_size_1080_117_end.jpg)
团队在这个版本设计了全新的Computer API,并且与原本的Open Interpreter分离,可以独立运作。
![](https://web.popo8.com/202401/15/2/e3438b53c2type_png_size_1080_62_end.jpg)
在新版本更新文档中,可以看出团队更大的野心:着手开发AI时代新的计算机架构,也就是语言模型计算机LMC(Language Model Computer)。
![](https://web.popo8.com/202401/15/7/f5018c06detype_png_size_1080_117_end.jpg)
Kilian借助CES上199元的AI掌机Rabbit R1爆火的机会公开招募开发者加入,打算快速复刻一个开源版本,硬件成本不到50美元。
![](https://web.popo8.com/202401/15/4/b0c6ff84c0type_png_size_1080_67_end.jpg)
不到48小时,就有超过200位工程师和设计师愿意加入这个项目,评论区中还不断有人继续申请中。
不知道这个团队回复大量应聘邮件和私信,用的是不是AI。
参考链接:
[1]https://twitter.com/fieroty/status/1746639975234560101
[2]https://github.com/KillianLucas/open-interpreter
Advertisements
网编:和评 |
|
8 条 | |||
|
|||||
【科技频道】【宠物情缘】
敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。