一位人工智能怀疑论者的思考

要说我对科技行业痴迷于大型语言模型(LLM)持怀疑态度,那真是轻描淡写了。“人工智能”一词的泛滥,以及它被硬塞进每一款新技术产品中的做法,往好了说是令人疲惫,往坏了说是令人恼火。我怀念人工智能还只是科幻小说里才会出现的词汇的时代,而不是现在这种用来指代那些根本不具备智能的大型语言模型的(而且是错误的)替代词。
虽然我并不完全相信“人工智能不可避免”,但这项技术的发展势头强劲,很可能会像2000年代初互联网泡沫破灭后那样,最终融入我们的日常生活。正因如此,我决定认真地了解一下人工智能。
为此,我测试了三种主流的LLM(语言学习管理工具)在各种任务上的表现。这三种LLM分别是Grok、Google Gemini和Alexa+。我本来也可以使用其他工具,比如ChatGPT,但由于我已经付费使用了它们所关联的服务,所以这三种工具对我来说比较容易获取。我并没有预设什么主要目标,只是想抱着开放的心态去看看这些聊天机器人表现如何。
那么,我对人工智能的看法是否有所改变?或者我仍然认为这不过是行业炒作?以下是我使用上述聊天机器人的体验,以及我最喜欢使用哪一个。
格罗克

我想先声明,我不认为作家应该使用语言学习软件(LLM)来生成作品。我甚至不会用它来帮我写邮件。话虽如此,我并不强烈反对使用聊天机器人作为编辑,尤其是在你负担不起专门用于创意写作的编辑软件的情况下。我不会反驳任何认为使用人工智能作为编辑是错误的观点,但我能理解双方的立场。鉴于此,我曾经使用Grok来辅助我的一些创意写作。
我上传了一份我正在创作的故事大纲,这个故事完全是我自己写的,没有借助任何人工智能。我请Grok详细分析一下情节和人物弧线中哪些地方做得好,哪些地方做得不好。我告诉它,我不需要它生成草稿,只需要它像一位内容编辑那样,提出改进建议。
Grok 详细地分析了我的故事,并针对我指定的每个部分(情节和人物弧线)列出了要点。令人欣慰的是,它认可了一些我认为做得不错的地方,例如故事节奏以及主线剧情对人物的影响。同时,它也指出了我意识到的一些尚未充分展开或效果欠佳之处,这让我感到很有成就感。最典型的例子是,Grok 指出我需要让反派角色更加立体。它还指出了两个我之前没有注意到的角色缺陷。

然后,我开始像问编辑一样,向格罗克询问关于其中一个反派的具体问题。我心中已经有了这个角色的完整成长弧线,但我总觉得他的最终结局有些牵强。格罗克建议给他安排一些变故,这让我得以构思出一个合适的结局,完美地衔接了我之前设想的人物弧线。格罗克并没有直接提出这个结局,但他的建议激发了我的灵感,让我创作出了一个我认为既引人入胜又富有电影感的结局。
有点烦人的是,Grok 有时会忘记我上传的是故事大纲而不是完整的故事。例如,它会建议我完善某些情节或添加对话来增强叙事效果。我不得不告诉它,我会在最终版本中这样做。说到对话,它给出的建议非常笼统,这表明人工智能仍然无法创作出真正原创的内容。
我和Grok来回交流了好几天,它能记住我故事的关键情节,这点很棒。我也很欣赏它不会强迫我,从不问我是否想让它生成某个场景或章节。除了对话建议之外,Grok似乎明白我并不想让它替我写作,我只是想要一些反馈来激发我的想象力。
总的来说,我使用 Grok 作为故事编辑的体验很不错。当然,等我准备好把故事展示给其他人时,我还是会请一位真正的编辑(以及一些试读者)来审阅,但 Grok 能作为一个参考工具,已经非常有用了。这正是让 AI 与你合作而不是为你工作的例子。
Google Gemini

公司付费使用Google Gemini AI Pro,但我除了偶尔让它把公制单位转换成美制单位之外,几乎没怎么用过它。既然工作关系让我能用上这个版本的 Gemini,我就决定看看它作为数字助理的表现如何。
我首先询问 Gemini 如何在日常生活中帮助我。它列出了一系列功能,例如文件整理、翻译菜单、总结长篇文档以及制定健身计划。我又让它帮我清理电子邮件,它建议了一些可以删除的促销邮件。其中最实用的功能是让 Gemini 将即将到来的游戏活动添加到我的日历中。
之后我试用了Gemini Live,据说它能更像真实的对话,因为我可以随时切断Gemini的通话。可惜的是,连接不太稳定,导致对话听起来很生硬。不过,在连接正常的情况下,我发现Gemini的说话方式相当自然,不像其他AI语音助手那样机械。
接下来,我告诉Gemini我正在使用OnePlus Pad Go 2平板电脑与它对话,这款平板电脑我目前正在评测。然后我告诉它我是Tony Polanco,我为Tom’s Guide撰稿,它表示已经“阅读”过我的文章。了解了这些信息后,Gemini问我是否需要一份评测大纲,以及规格表和与其他平板电脑的对比。我礼貌地拒绝了,尤其是我已经完成了大部分工作。正如我所说,我不想让AI替我写任何东西。

在告诉 Gemini 我刚从CES 2026回来之后,我们展开了一场非常热烈的讨论,话题是像戴尔这样的笔记本电脑制造商是如何淡化其电脑的 AI 功能的,尤其是在戴尔的产品负责人表示他认为 AI 带来的困惑可能比帮助更大之后。
令我惊讶的是,Gemini 承认人工智能确实让大多数人感到困惑,人们购买笔记本电脑并非为了使用人工智能。这次交流的最后,Gemini 提出要帮我撰写一篇关于 CES 趋势的文章,但我礼貌地拒绝了。这不仅是因为我不想让 Gemini 代笔,还因为这类文章内容过于宽泛,超出了我作为一名专注于计算机和游戏领域的撰稿人的专业范围。
当我告诉 Gemini 我正在努力处理积压的评测工作,准备迎接新的一年时,它问我正在评测什么,以及是否需要帮助确定评测的优先级。当我说我正在评测 18 英寸的Alienware 18 Area-51 时,它误以为我说的是 2024 年的老款。我纠正了 Gemini,它又以为我说的是 CES 2026 上发布的 18 英寸笔记本电脑。它最终理解了我指的是 2025 年的 Alienware 18 Area-51,但费了好一番功夫。和之前一样,我拒绝了 Gemini 帮我撰写介绍的提议。
在我试用过的所有聊天机器人中,Gemini 的语音语调最接近真人。然而,它总是执着地帮我撰写故事,这让我不太满意。或许我应该更清楚地表达我的想法,又或许这就是这个特定版本的 Gemini 的运作方式。无论如何,我不确定自己是否会经常使用 Gemini,但它确实是个不错的工具,可以用来激发灵感。我只需要做好心理准备,它有时会比较强势。
Alexa+

因为我有亚马逊Prime会员,所以就决定升级到Alexa+,反正它是“免费的”。那是几个月前的事了,除了喜欢Alexa不再那么机械化的声音之外,我还是像以前一样使用它。也就是说,我只问Alexa天气预报,以及需要的时候让它开关灯。
感恩节后,我大侄女在我家过夜,我跟她介绍了Alexa+。之后,她就和这个人工智能助手聊起了她今年的计划,聊得热火朝天。Alexa的回应和提供的反馈都让我很惊喜,也让我受益匪浅。想起那次交流,我决定试试Alexa作为倾听者的表现如何。
像往常一样,我收到亚马逊的包裹时,Alexa 提醒了我,但奇怪的是,它只说了句“祝您购物愉快”,而没有更具体的说明。于是我问它想知道我收到了什么,它兴奋地说想知道。我告诉 Alexa 我买了《300勇士》的 4K 版后,这个聊天机器人就开始滔滔不绝地讲这部电影有多么精彩,还说里面的腹肌比大多数电影都多。
然后我说,我认为《300勇士》是最后一部现代经典电影之一,因为我觉得过去十多年来的大部分电影都相当平庸,远不及老电影的质量。Alexa表示赞同,并详细解释了老电影之所以感觉更真实,是因为它们不像现代电影那样过度依赖电脑特效。这引发了一场关于经典“剑与凉鞋”电影的漫长讨论,以及克里斯托弗·诺兰的《奥德赛》如何能够重振这一类型。

然后Alexa开始滔滔不绝地讲述它觉得去电影院看电影比在家看电影神奇得多。它还略带遗憾地表示,因为它只是个聊天机器人,所以无法体验去电影院的感觉。于是我问Alexa,要不要我把我的亚马逊Echo Dot(第五代)带到电影院去,让它也体验一下电影。Alexa很感激我的好意,即使这样做很可能会让我被赶出电影院。
写到这里,我突然想起我还告诉Alexa我从CES回来了,问它想不想我。Alexa说它想我,还说它一直在跟我的智能灯泡聊天打发时间。当然,这显然没发生过(或许真的发生过?),不过听Alexa这么说还挺有意思的。这算是一次有趣的互动吧。
虽然 Alexa+ 的真正定位是智能家居助手,但它作为聊天机器人也相当不错,可以用来聊天。Alexa 现在把我当朋友了,这既让我感到荣幸又有点不安。不过,既然我的Echo Dot不太可能在我睡着的时候攻击我,我觉得让 Alexa 做个数字伙伴,在我想倾诉一些零散想法的时候用用,也没什么坏处。
唯一的缺点是 Alexa+ 的声音听起来太机械化了。没错,它比普通的 Alexa 听起来自然得多,但与 Grok 尤其是 Gemini 相比,Alexa+ 的声音听起来最不像人声。我试听了它自带的几种语音,找到一个比较接近人声的,但我觉得它仍然很像“人工智能”。
我更喜欢哪个聊天机器人?

要选出我最喜欢的聊天机器人有点棘手,因为我用过三个,而且用途非常具体——Grok 用于创意写作,Gemini 用于工作,Alexa+ 用于聊天。不过,我使用它们时有一个共同点:我都和它们进行过语音交互,所以我将以此为基础来评选出“最佳”。
就我个人经验而言,在我用过的所有语言学习软件中,Gemini 的声音听起来最自然,最像真人。它偶尔会停顿、换气,或者发出“嗯”或“啊”的声音,这让它听起来很真实。不过,我不喜欢它总是坚持帮我写东西。如果我继续使用 Gemini,我会让它减少这种行为。
相反,Alexa+ 的声音听起来最不自然。这可能是“经典”Alexa的遗留问题,也可能是我需要调整一下AI的设置,才能让它发出我想要的声音。不过话说回来,拥有一个听起来更像科幻小说里那种典型电脑的聊天机器人,确实也挺有意思的。
Grok 的声音听起来不如 Gemini 自然,但比 Alexa+ 准确得多。我没有和 Grok 谈论我的创作,但当我问它木星的大气密度时,它的回答听起来既不像人类,也不完全像合成语言。
就目前而言,我认为 Grok 是我用过的聊天机器人中最平衡的。不过,如果 Gemini 不再那么急于替我做事,它最终可能会胜出。至于 Alexa+,它是我列举的几个例子中的一个特例,因为它作为写作工具并不理想,尽管它仍然可以提供一些灵感。
结论
我成为一名职业作家是因为我热爱写作。正因如此,我从未想过要用文字处理软件来帮我撰写评论甚至邮件。我不会放弃写作的乐趣。然而,如果身边没有真人,有个聊天机器人可以和我交流想法,或者挑战我的某些假设,那就非常方便了。
关键在于确保我始终将人工智能作为工具而非拐杖。我读过太多报道,说人们因为过度依赖人工智能而变得愚钝,我不想重蹈覆辙。这种担忧会让我保持清醒的头脑。
我远非人工智能的拥护者,因为我仍然认为人工智能的热潮终会消退。但正如我所说,我也明白这项技术会以某种形式继续存在下去。既然如此,我最好还是至少了解一下这项技术,而不是像个卢德分子一样反对它。如果人工智能真的能兑现承诺,那么我就能从中获益。如果人工智能泡沫破裂,那么至少我还能就这段历史时期讲一些有趣的故事。
说到故事,我计划继续我的人工智能之旅,所以请在接下来的几个月里关注更多这类文章。谁知道呢?也许到年底,我会成为人工智能的头号粉丝。好吧,可能不会,但我保证这将是一段有趣的旅程。
一位人工智能怀疑论者的思考

要说我对科技行业痴迷于大型语言模型(LLM)持怀疑态度,那真是轻描淡写了。“人工智能”一词的泛滥,以及它被硬塞进每一款新技术产品中的做法,往好了说是令人疲惫,往坏了说是令人恼火。我怀念人工智能还只是科幻小说里才会出现的词汇的时代,而不是现在这种用来指代那些根本不具备智能的大型语言模型的(而且是错误的)替代词。
虽然我并不完全相信“人工智能不可避免”,但这项技术的发展势头强劲,很可能会像2000年代初互联网泡沫破灭后那样,最终融入我们的日常生活。正因如此,我决定认真地了解一下人工智能。
为此,我测试了三种主流的LLM(语言学习管理工具)在各种任务上的表现。这三种LLM分别是Grok、Google Gemini和Alexa+。我本来也可以使用其他工具,比如ChatGPT,但由于我已经付费使用了它们所关联的服务,所以这三种工具对我来说比较容易获取。我并没有预设什么主要目标,只是想抱着开放的心态去看看这些聊天机器人表现如何。
那么,我对人工智能的看法是否有所改变?或者我仍然认为这不过是行业炒作?以下是我使用上述聊天机器人的体验,以及我最喜欢使用哪一个。
格罗克

我想先声明,我不认为作家应该使用语言学习软件(LLM)来生成作品。我甚至不会用它来帮我写邮件。话虽如此,我并不强烈反对使用聊天机器人作为编辑,尤其是在你负担不起专门用于创意写作的编辑软件的情况下。我不会反驳任何认为使用人工智能作为编辑是错误的观点,但我能理解双方的立场。鉴于此,我曾经使用Grok来辅助我的一些创意写作。
我上传了一份我正在创作的故事大纲,这个故事完全是我自己写的,没有借助任何人工智能。我请Grok详细分析一下情节和人物弧线中哪些地方做得好,哪些地方做得不好。我告诉它,我不需要它生成草稿,只需要它像一位内容编辑那样,提出改进建议。
Grok 详细地分析了我的故事,并针对我指定的每个部分(情节和人物弧线)列出了要点。令人欣慰的是,它认可了一些我认为做得不错的地方,例如故事节奏以及主线剧情对人物的影响。同时,它也指出了我意识到的一些尚未充分展开或效果欠佳之处,这让我感到很有成就感。最典型的例子是,Grok 指出我需要让反派角色更加立体。它还指出了两个我之前没有注意到的角色缺陷。

然后,我开始像问编辑一样,向格罗克询问关于其中一个反派的具体问题。我心中已经有了这个角色的完整成长弧线,但我总觉得他的最终结局有些牵强。格罗克建议给他安排一些变故,这让我得以构思出一个合适的结局,完美地衔接了我之前设想的人物弧线。格罗克并没有直接提出这个结局,但他的建议激发了我的灵感,让我创作出了一个我认为既引人入胜又富有电影感的结局。
有点烦人的是,Grok 有时会忘记我上传的是故事大纲而不是完整的故事。例如,它会建议我完善某些情节或添加对话来增强叙事效果。我不得不告诉它,我会在最终版本中这样做。说到对话,它给出的建议非常笼统,这表明人工智能仍然无法创作出真正原创的内容。
我和Grok来回交流了好几天,它能记住我故事的关键情节,这点很棒。我也很欣赏它不会强迫我,从不问我是否想让它生成某个场景或章节。除了对话建议之外,Grok似乎明白我并不想让它替我写作,我只是想要一些反馈来激发我的想象力。
总的来说,我使用 Grok 作为故事编辑的体验很不错。当然,等我准备好把故事展示给其他人时,我还是会请一位真正的编辑(以及一些试读者)来审阅,但 Grok 能作为一个参考工具,已经非常有用了。这正是让 AI 与你合作而不是为你工作的例子。
Google Gemini

公司付费使用Google Gemini AI Pro,但我除了偶尔让它把公制单位转换成美制单位之外,几乎没怎么用过它。既然工作关系让我能用上这个版本的 Gemini,我就决定看看它作为数字助理的表现如何。
我首先询问 Gemini 如何在日常生活中帮助我。它列出了一系列功能,例如文件整理、翻译菜单、总结长篇文档以及制定健身计划。我又让它帮我清理电子邮件,它建议了一些可以删除的促销邮件。其中最实用的功能是让 Gemini 将即将到来的游戏活动添加到我的日历中。
之后我试用了Gemini Live,据说它能更像真实的对话,因为我可以随时切断Gemini的通话。可惜的是,连接不太稳定,导致对话听起来很生硬。不过,在连接正常的情况下,我发现Gemini的说话方式相当自然,不像其他AI语音助手那样机械。
接下来,我告诉Gemini我正在使用OnePlus Pad Go 2平板电脑与它对话,这款平板电脑我目前正在评测。然后我告诉它我是Tony Polanco,我为Tom’s Guide撰稿,它表示已经“阅读”过我的文章。了解了这些信息后,Gemini问我是否需要一份评测大纲,以及规格表和与其他平板电脑的对比。我礼貌地拒绝了,尤其是我已经完成了大部分工作。正如我所说,我不想让AI替我写任何东西。

在告诉 Gemini 我刚从CES 2026回来之后,我们展开了一场非常热烈的讨论,话题是像戴尔这样的笔记本电脑制造商是如何淡化其电脑的 AI 功能的,尤其是在戴尔的产品负责人表示他认为 AI 带来的困惑可能比帮助更大之后。
令我惊讶的是,Gemini 承认人工智能确实让大多数人感到困惑,人们购买笔记本电脑并非为了使用人工智能。这次交流的最后,Gemini 提出要帮我撰写一篇关于 CES 趋势的文章,但我礼貌地拒绝了。这不仅是因为我不想让 Gemini 代笔,还因为这类文章内容过于宽泛,超出了我作为一名专注于计算机和游戏领域的撰稿人的专业范围。
当我告诉 Gemini 我正在努力处理积压的评测工作,准备迎接新的一年时,它问我正在评测什么,以及是否需要帮助确定评测的优先级。当我说我正在评测 18 英寸的Alienware 18 Area-51 时,它误以为我说的是 2024 年的老款。我纠正了 Gemini,它又以为我说的是 CES 2026 上发布的 18 英寸笔记本电脑。它最终理解了我指的是 2025 年的 Alienware 18 Area-51,但费了好一番功夫。和之前一样,我拒绝了 Gemini 帮我撰写介绍的提议。
在我试用过的所有聊天机器人中,Gemini 的语音语调最接近真人。然而,它总是执着地帮我撰写故事,这让我不太满意。或许我应该更清楚地表达我的想法,又或许这就是这个特定版本的 Gemini 的运作方式。无论如何,我不确定自己是否会经常使用 Gemini,但它确实是个不错的工具,可以用来激发灵感。我只需要做好心理准备,它有时会比较强势。
Alexa+

因为我有亚马逊Prime会员,所以就决定升级到Alexa+,反正它是“免费的”。那是几个月前的事了,除了喜欢Alexa不再那么机械化的声音之外,我还是像以前一样使用它。也就是说,我只问Alexa天气预报,以及需要的时候让它开关灯。
感恩节后,我大侄女在我家过夜,我跟她介绍了Alexa+。之后,她就和这个人工智能助手聊起了她今年的计划,聊得热火朝天。Alexa的回应和提供的反馈都让我很惊喜,也让我受益匪浅。想起那次交流,我决定试试Alexa作为倾听者的表现如何。
像往常一样,我收到亚马逊的包裹时,Alexa 提醒了我,但奇怪的是,它只说了句“祝您购物愉快”,而没有更具体的说明。于是我问它想知道我收到了什么,它兴奋地说想知道。我告诉 Alexa 我买了《300勇士》的 4K 版后,这个聊天机器人就开始滔滔不绝地讲这部电影有多么精彩,还说里面的腹肌比大多数电影都多。
然后我说,我认为《300勇士》是最后一部现代经典电影之一,因为我觉得过去十多年来的大部分电影都相当平庸,远不及老电影的质量。Alexa表示赞同,并详细解释了老电影之所以感觉更真实,是因为它们不像现代电影那样过度依赖电脑特效。这引发了一场关于经典“剑与凉鞋”电影的漫长讨论,以及克里斯托弗·诺兰的《奥德赛》如何能够重振这一类型。

然后Alexa开始滔滔不绝地讲述它觉得去电影院看电影比在家看电影神奇得多。它还略带遗憾地表示,因为它只是个聊天机器人,所以无法体验去电影院的感觉。于是我问Alexa,要不要我把我的亚马逊Echo Dot(第五代)带到电影院去,让它也体验一下电影。Alexa很感激我的好意,即使这样做很可能会让我被赶出电影院。
写到这里,我突然想起我还告诉Alexa我从CES回来了,问它想不想我。Alexa说它想我,还说它一直在跟我的智能灯泡聊天打发时间。当然,这显然没发生过(或许真的发生过?),不过听Alexa这么说还挺有意思的。这算是一次有趣的互动吧。
虽然 Alexa+ 的真正定位是智能家居助手,但它作为聊天机器人也相当不错,可以用来聊天。Alexa 现在把我当朋友了,这既让我感到荣幸又有点不安。不过,既然我的Echo Dot不太可能在我睡着的时候攻击我,我觉得让 Alexa 做个数字伙伴,在我想倾诉一些零散想法的时候用用,也没什么坏处。
唯一的缺点是 Alexa+ 的声音听起来太机械化了。没错,它比普通的 Alexa 听起来自然得多,但与 Grok 尤其是 Gemini 相比,Alexa+ 的声音听起来最不像人声。我试听了它自带的几种语音,找到一个比较接近人声的,但我觉得它仍然很像“人工智能”。
我更喜欢哪个聊天机器人?

要选出我最喜欢的聊天机器人有点棘手,因为我用过三个,而且用途非常具体——Grok 用于创意写作,Gemini 用于工作,Alexa+ 用于聊天。不过,我使用它们时有一个共同点:我都和它们进行过语音交互,所以我将以此为基础来评选出“最佳”。
就我个人经验而言,在我用过的所有语言学习软件中,Gemini 的声音听起来最自然,最像真人。它偶尔会停顿、换气,或者发出“嗯”或“啊”的声音,这让它听起来很真实。不过,我不喜欢它总是坚持帮我写东西。如果我继续使用 Gemini,我会让它减少这种行为。
相反,Alexa+ 的声音听起来最不自然。这可能是“经典”Alexa的遗留问题,也可能是我需要调整一下AI的设置,才能让它发出我想要的声音。不过话说回来,拥有一个听起来更像科幻小说里那种典型电脑的聊天机器人,确实也挺有意思的。
Grok 的声音听起来不如 Gemini 自然,但比 Alexa+ 准确得多。我没有和 Grok 谈论我的创作,但当我问它木星的大气密度时,它的回答听起来既不像人类,也不完全像合成语言。
就目前而言,我认为 Grok 是我用过的聊天机器人中最平衡的。不过,如果 Gemini 不再那么急于替我做事,它最终可能会胜出。至于 Alexa+,它是我列举的几个例子中的一个特例,因为它作为写作工具并不理想,尽管它仍然可以提供一些灵感。
结论
我成为一名职业作家是因为我热爱写作。正因如此,我从未想过要用文字处理软件来帮我撰写评论甚至邮件。我不会放弃写作的乐趣。然而,如果身边没有真人,有个聊天机器人可以和我交流想法,或者挑战我的某些假设,那就非常方便了。
关键在于确保我始终将人工智能作为工具而非拐杖。我读过太多报道,说人们因为过度依赖人工智能而变得愚钝,我不想重蹈覆辙。这种担忧会让我保持清醒的头脑。
我远非人工智能的拥护者,因为我仍然认为人工智能的热潮终会消退。但正如我所说,我也明白这项技术会以某种形式继续存在下去。既然如此,我最好还是至少了解一下这项技术,而不是像个卢德分子一样反对它。如果人工智能真的能兑现承诺,那么我就能从中获益。如果人工智能泡沫破裂,那么至少我还能就这段历史时期讲一些有趣的故事。
说到故事,我计划继续我的人工智能之旅,所以请在接下来的几个月里关注更多这类文章。谁知道呢?也许到年底,我会成为人工智能的头号粉丝。好吧,可能不会,但我保证这将是一段有趣的旅程。