GLM-PC – 智谱推出的电脑智能体，基于CogAgent视觉多模态模型构建-爱论文

GLM-PC是什么

GLM-PC是智谱AI基于CogAgent视觉多模态模型开发的通用Agent，能模拟人类操作计算机，实现“无人驾驶”PC的技术探索。GLM-PC能执行预定会议、文档处理、网页搜索总结等任务，支持远程和定时操作。GLM-PC能模拟人眼看、脑规划、手执行的方式使用电脑，具备跨平台能力，不依赖HTML或API，有更高的能力上限。目前处于内测阶段，旨在提升使用工具能力，探索自我学习能力。

GLM-PC的主要功能

会议替身：帮助用户预定和参与会议，并发送会议总结。文档处理：支持文档的下载、发送及理解和总结文档内容。网页搜索与总结：在指定平台（如微信公众号、知乎、小红书等）搜索指定关键词，并完成阅读、总结。远程和定时操作：用手机远程发送指令，GLM-PC能自主完成电脑操作，或设定在未来的某个时间点，在开机状态下定时执行任务。隐形屏幕：在用户工作时，在不占用用户屏幕的情况下自主完成工作，解放屏幕使用权。

GLM-PC内测申请地址

GLM-PC「邀请体验」已开启，需填写问卷申请内测。

如何使用GLM-PC

安装和设置：确保电脑是搭载M系列芯片的Mac电脑，推荐M1和M3系列设备。访问GLM-PC的官方网站获取GLM-PC的安装包。按照网站的指示完成下载和安装过程。用户授权：首次使用时，需要授权GLM-PC访问某些电脑功能和数据，以便够执行任务。输入指令：打开GLM-PC应用后，在对话框中输入想要进行的操作指令。例如，输入“查询B站热门内容”或“预定腾讯会议并发送会议邀请”。执行任务：GLM-PC评估指令并决定操作计划，然后自动执行任务。例如，它可能会打开浏览器搜索信息，或者打开日历应用预定会议。敏感操作确认：当遇到敏感操作时，GLM-PC自动暂停并等待用户的确认。用户需要点击控制条上的继续按钮继续任务。远程操作：如果需要通过手机远程操作电脑，在GLM-PC设置中打开“挂起模式”，远程发送指令。

GLM-PC的应用场景

信息处理：适配微信、飞书、钉钉，向联系人或群聊发送信息。会议安排：适配腾讯会议、飞书会议等，预定会议日程、发送会议邀请；定时加入指定会议。文档处理：支持文档下载、发送、理解和总结文档。网页内容处理：打开浏览器，在百度、公众号、知乎、小红书等平台搜索关键词，进行阅读总结或翻译。电子商务：在淘宝上购买特定尺码的羽绒服并完成购买流程。