引:

从 ChatGPT 掀起生成式大语言模型的 AI 浪潮起,《银翼杀手2049》的 Joi、《钢铁侠》的 J.A.R.V.I.S.、《她》中的 Samantha 等电影中的人工智能助手不断地被大家提及。如果每个人都可以拥有一个专属的个人助手:

拥有和你对齐的记忆,洞察你的需求,时刻 standby;

了解你的喜好,无论是音乐、电影还是你的小众爱好;

管理并提醒你的日程安排,从学习计划到工作安排,一切都井井有条;

...

这样想来也蛮酷的,很符合我对未来生活的想象。

在 GPT-4o 发布时,也被很多媒体称为「现实版的《Her》」,不过这似乎是一种过度吹捧,毕竟谁的「个人助手」会只给你提供一个搜索框呢?

Personal AI

近两年诞生了很多标签带有「Personal AI」的应用,与ChatGPT、Poe、Claude 等网页 ChatBot 不同的是,这些应用的针对的场景更加细分,通过工程能力对更多功能进行封装和串联。比起 ChatBot 用户通过 prompt 作不同角色的调用来完成写作、代码、总结等独立性任务,Personal AI 们的侧重点更「个人」。

Pi:拟人化能力更强的 ChatBot

Pi AI的设计初衷是成为一个支持性强、智能且随时待命的对话伙伴。它通过深度学习技术,能够理解复杂的自然语言输入,并提供个性化的回应。Pi AI的对话能力不仅限于简单的问答,它还能够提供建议、生成创意文本,甚至帮助用户学习新技能。

在我的视角下,Pi 与其他 AI 助手核心的不同在于「足够拟人」。这个拟人并不是 Character.ai 那种真实的角色扮演:

  • 情绪连结

在与的 Pi 的对话中能感知到「情绪」,Pi 会在对话中添加 emoji、认可和赞美等来与用户建立感情联系;

  • 主动提问

在对话过程中 Pi 通过「主动提问」来挖掘用户的更多信息以将对话延续下去

以主动提问为例,普遍采用的 chat 流程内延续对话的方式是在回答下提供相关 query 供用户参考,但是这种模式并不适用 AI 助理场景,因为我们需要 AI 助理「人格化」。因此主动提问是更好、更具有人格化的助理交互模式。

Pi 与 ChatGPT 的核心区别似乎是:Pi 不想当一个工具,而是你的虚拟 pattner。

Personal.ai:(或许是)手机厂商理想的智能助手

Personal AI 就像是你的个人助手,它可以帮你记住生活中的各种信息,比如你下周的晚餐计划或者工作会议的内容。所有的这些信息都会被它自动整理和索引,你只需要通过聊天就能找到你需要的信息。

Personal.ai 在应用上具有较为完整使用体验,提供了聊天、群组、AI 工具等。可以通过文字、Google Drive、Twitter 等进行个人 AI 的训练。Personal.ai 在我的视角下核心是对 Memory 的收束和反馈:

  • Memory Stack

可以通过多种方式作数据的上传:文件、URLs、文字、媒体视频,上传的数据会被总结并整合,也可以通过对话进行记忆和信息的校准,让你的数字分身更「像」你。

  • Personal Score

Personal AI 可以通过 memory stack 训练自己的数字分身,提供了 Copilot 和 Autopilot 两种 AI 消息回复模式

在 AI copilot 模式下,你可以预览并修改 AI 根据你的记忆生成的回复内容;

在 AI autopilot 模式下,AI 可以根据 memory 自动回复和他人的消息;

Personal Score 的作用是「AI 衡量它为你生成回复的准确程度」,得分越高,人工智能就越确信它提供的答案可能来自你。用户也可以设置一个阈值,低于阈值自动转进 copilot 模式,需要用户进行主动编辑&发送。

对于 Personal AI 唯一的问题是使用平台的限定比较大(或许是出于对用户隐私的考虑),但值得一提的是,个人数字分身的 AI Copilot/Autopilot 回复模式在工作/个人场景下都是一种很有趣的交互(copilot)状态

Me.bot:更轻量且可对话的 Obsidian

在忙碌时刻,Me.bot已经为你整理好内容摘要和重点,生成了个性化的分析和见解。

在工作中,当你需要专注于战略决策时,Me.bot已经为你完成了数据分析和报告撰写。

从官方页面大大的「Dump Anything」到其他同学的使用分享,再到我自己的使用体验,Me.bot 似乎想做我的第二个大脑,也诚如这部分的小标题「更轻量且可对话的 Obsidian」,对比flomo、Obsidian、Notion等笔记软件,Me.bot 给到我的印象是:更轻量&更“AI”。

  • 灵感的记录和回顾

Me.bot 会识别你和它的零散对话内容,并将对话 convert 到相关的 note 中。另外在 Me.bot 中每一条 memory 都可以与过去相关的记忆和内容相连接,你可以进行 memory 的搜索,它也会主动生成回顾帮你进行回忆。

  • 知识的连结

与 Personal.ai 的 memory 对比来看,Me.bot 并不想再造一个「你」,而是以「知识」为核心,围绕着这一点作个人知识的上传、highlight、总结。

Me.bot 可以视为一种:以大模型为核心的个人知识网络。相较于传统知识管理工具,提供了更多作为原生 AI 应用带来的 AI 能力,整体的交互体验也更轻量。

我真正需要什么?

首先我要在这里明确一个观点:相比于互联网行业蓬勃发展的过去,AI 工具/应用不会创造出新需求,而是对用户需求的代位和迁移。这就意味着旧时代「通过创造用户需求以谋求增长」的旧思维,在 AI 这个新业态下并不适用。无论是产品还是运营,要向用户明确传达的信息将会是:

AI 可以帮助你做什么

AI 应用/工具主要的价值点在于:A:单一任务节点的替代;B:多流程任务的提速,所以讲清替代价值的重要性远大于创造新需求(新业态下,似乎也并没有新需求被创造出来);

哪些事需要你决策/干预

当前业态下,同一个赛道的 AI 应用有近似无限多的“平替”产品。为了吸睛,部分产品选择在运营上采取了比较夸张的口径,但是对于整个行业而言,目前状态下的 AI 应用,更重要的还是通过合理的场景+文案,阐明用户在接入 AI 的workflow 后,哪些节点需要用户参与决策让 AI 作调整。另外对于模型/应用的效果,要有合理的描述让用户认识到局限,管理并修正用户的预期。

在这个前提下,我对 AI 个人助理的需求进行收束和归纳成以下几项:

  • 信息的储存、分析和检索

对于知识、记忆、想法、习惯等个人信息,AI 应用需要对应提供储存和分析,将用户零散的知识内容进行归类存档和总结。在对话中,也需要结合用户提供给 AI 的记忆进行回答,提供用户更好的使用体验。

  • 自动化任务及待办管理

对与 AI 的对话信息和用户对话信息进行识别,进行自动化任务创建,通过 RPA、搜索等工程能力,向用户提供更丝滑的日常支持。另外也需要通过对话信息,进行用户待办的创建和主动提醒,通过主动服务进行场景的拓宽。

  • 跨平台协作

对 web 端/APP 端进行统一的产品规划,可以在双端提供不对称的功能,例如使用负担较重的功能只在 web 端提供,但要给到双端,丝滑且合理的信息同步和协作方式。

  • 个性化成长和进化

在与用户的交互&学习前,明确 AI 的迭代目的,通过知识和记忆等信息的训练,让 AI 更符合用户的使用习惯,使工具和用户一起成长。

以上是根据场景做的简要分析,每个人对在场景下需求或许不尽相同的,但是我们回归到 AI 即 Artificial Intelligence,是人工的对「人」的一种模拟。

那么在 personal AI 场景下无论在语气上还是在回复模式上「足够地像人」或许也是一个非常重要的 feature。

依旧存在的 Gap

无论是手机厂商、互联网大厂还是AI助手开发商,给 pesonal AI 名分或许是不同的,对于手机厂商来说是「手机智能助手」,对互联网大厂来说是「数字员工」,对开发商来说是「个人 AI 助理」。

本质上是在不同的应用场景下做更多定制化配置,以数字员工为例:

在「办公」这个严肃场景下,除了大模型能力和定制化 agent 能力之外,数字员工还需要满足的有两个大点:

  • 精准且通用的员工画像

精准:员工画像符合企业员工特点及形象,未经配置的数字员工依旧可以在一定程度上,根据员工的岗位&角色提供合适的答疑和响应;

通用:员工画像需要企业通用知识&员工岗位和角色的基础知识;

  • 广泛且垂直的场景挖掘

广泛:对内部场景进行穷举和典型场景的筛选和能力配置;

垂直:垂直场景的背景知识需要足够专业;

数字员工实际上是一个很大的命题,和 AI 对于工作的影响一样,足以重塑生产关系,在此不做赘述。

在体验过目前市面上的几个应用后,我有一种感觉:似乎 personal AI 是在自己塑造另一个自己,是对 AI 和你 建立一种深度的联系,不断的补充记忆、对话、对齐来修正 AI,让它更像你、更懂你。

在这种面向未来的可能性下,通用 personal AI 还需要解决:

  • 多模态信息感知

目前大多数 AI 应用仅支持文字内容的输入,部分支持 URL、图片等其他内容,本质上也是通过不同的组件进行文本识别。我们讲 AI 是机器对人的模拟,那么人的感官都需要输入给 AI,以期待得到更好的模拟结果。

  • 记忆对齐

数字分身对个人来讲是知识的存储,另一方面也可以相当程度上对工作和生活中常见的小任务进行 autopilot 模式的响应和决策。所以在这个前提下,「人」和「机」的对齐变得格外重要:

我的分身有哪些「它」的对话?

我的记忆怎么同步给数字分身?

  • 主动服务

目前的大部分 AI 应用都是一个被动 standby 的状态,我需要输入「背景+信息+任务」AI 去做执行。但是 personal AI 带有一个关键词「助理」,既然作为助理除了 standby 之外,也要主动对于对话内容进行分析、记录和响应,例如钉钉 AI 助理对群聊内容的识别和响应。

  • 更好的交互形态

大多数 AI 应用依旧是「输入框」的原始交互状态,在产品层面上,确实是需要更多的交互和产品形态的思考。例如,海螺 AI 的悬浮球,是一种低打扰、低侵入的跨应用的“复古但创新”的 AI 工具形态。

不仅是产品整体形态,产品内用户的使用门槛和使用成本也需要重新进行考量和设计。

或许未来的某一天,就会像某些穿越文中描述的系统一样「叮,检测到XXX,是否XX?」。我想这一天不会远,也期待着下一个世代的 APP 形态和交互体验。