关于机器写诗的两次讨论纪录

题记: 本文来源于作者近两年分别和两个朋友讨论机器创作时的一次采访和一次讨论。作者为yuhe, 华夏, moondance,jady.

第一次讨论

为什么相对于其他文类,你更青睐用诗歌?在你看来,在我们这个时代,诗歌有着什么样的独特性,使得它比之前受到更多人的关注或者喜爱?或者,为什么我们这个时代需要诗歌?

 

现在思考起来的话, 我觉得诗歌一种逻辑和情绪的最均衡的混合。诗歌是以文字的方式来进行意象的操纵, 情绪的表达,看过一个密涅瓦大学的学科分类, 把所有的学科分为「理論分析」、「實證分析」、「複雜系統」與「多元模式溝通」, 在这种分类方法中, 把绘画, 音乐, 诗歌, 文学都视为『沟通方法』类别下的子门类, 人们的沟通,除了逻辑和知识之外,更重要的是情绪, 体验, 感触的沟通和表达。这些更靠近人的真实存在的东西, 只能通过诗歌, 音乐, 绘画,雕塑等等艺术来展现。而这些形式中, 诗歌是惟一一个以文字为载体的。

我是做AI的, 文字的这种操纵能力是是人类独有的, 也是高级认知过程,语言逻辑所独有的形式。 因此,我的个人观点是, 诗歌是惟一一个在高级认知能力和人的生物性存在中最均衡的一种形式。 一句话、几个字的组合, 高度浓缩的信息, 却可以从如此压缩的信息传输中达到澎湃的情绪共鸣和交流。与其他文字类别相比, 诗歌更直接, 更抽象,更本真。

我不认为在这个时代, 诗歌更受到人的关注和喜爱, 我的身边,除了一小撮朋友外, 不读诗的人占据绝大多数, 而如果说时代需要诗歌的话, 我也没有能力去定义时代和观察时代, 只能从自己的专业和个人出发, 我认为, 诗歌的这种高度有序, 高度浓缩, 同时又是高度自我的表达方式, 是智能向高级认知能力发展之后, 又反过来与智能的产生者, 或者说生物性的人, 在关系中的人, 原始的人, 这种本真沟通的产物。我在其中看到一种人的独特性和不可替代性。也会从中体会到: 最珍贵的东西、 最珍贵的创造, 必然不单单是纯理性的,纯逻辑的, 而是掺杂和混合了生物性存在的一种东西。或者简单点说, 它也许能够把我们从对理智的迷思(事实上,你去那些即使是鄙视感性的人,他们从事某种理性工作的出发点也依然是感性和生物性的)中拯救出来吧。

其实我想象会有两种未来, 一种是大逃杀式、 饥饿游戏、 黑客帝国、 或者黑镜式的
另外一种是无姓之人、 或者十三层凶间片尾最后两分钟那种未来。

———————————————————
没有一种平和的吗? 我能选择把自己冷冻起来吗……

 

无姓之人, 十三层凶间里那种就是平和的
虽然十三层凶间名字很凶。。
不过它的画风是那种, 人穿的衣服是那种像禅修服一样, 简洁清爽型的。建筑都是绿化与日韩系性冷淡风格的。无姓之人我觉得也是。

———————————————————
可是这样也会显得单调, 我有时候还挺喜欢浓烈的东西。

 

那种未来里的人, 人们看起来都很神棍, 一个个看起来像灵修者一样。

———————————————————
也是,浓烈可能是能量的一种浪费吧

 

那我就不确定了, 浓烈的话。也许像神经漫游者一样?
我说那两种未来, 是指人的心智结构有所变化。类似于认为科技会提出一些挑战, 而人的心智在应对这种挑战的时候, 产生了那两种未来。
而如果是浓烈的话, 比如神经漫游者那种, 人的心智是和现在没什么区别的。
只是科技进步, 其他的都完全一样。科技也单单只是工具

———————————————————
反正,我觉得差异化还是好的,不然一致了会无趣啊
我是说那种冷淡的风格

 

我不知道, 现在想来可能会比较无趣, 到那个时候也许会习惯吧。
就像你要穿越回十年前, 告别人说十年后, 所有人天天都会拿着一块屏幕不抬头, 估计他们也会崩溃掉, 无法理解。。

———————————————————
还想问下,你有特别偏爱谁的诗(北岛?),或者哪种风格的诗?

 

北岛,聂鲁达, 辛波斯卡, 佩索阿, 古诗有李白, 李商隐和晏几道,苏轼这几位吧。 风格的话, 可能是冷峻, 狂野, 疏离, 迷茫,思辩,放达,痴缠带有这种味道的诗歌。

———————————————————
我还有个问题。不是小冰也写诗?你怎么看,机器写诗与人之间的差异?

 

小冰是也写诗, 我看过小冰写的诗, 大概的感觉就是, 不知所云。
从形式上看倒是很有诗的感觉。
但是意象堆在一起, 不知道要传达什么。
很混乱。
所以看完以后, 就算有些想象, 我也能知道那完全是我对意象之间引发的想象的联想 。而且意象的组织是没有统摄的。
人写诗, 使用意象的时候, 经常是有种情绪需要表达, 或者有种体验需要传递, 于是所有的意象是围绕那个情绪和体验, 而机器写诗, 就目前我对自然语言处理的理解而言, 远远没有到意象表达的地步。只是对于语言模型对于诗歌的学习。这种诗歌, 能够保证每个句子都是自然流畅的, 如果学习的好了, 甚至两个句子偶尔会出现关联。好像让人眼前一亮。
但是由于没有意象的统摄, 所以往长了看, 整个诗歌是没有组织的。
所以让人看了感觉很跳, 像个精神分裂症患者的思维奔逸。。。

———————————————————
总之,你觉得目前的人工智能没有到达人类的写诗水平,将来呢……能不能根据某一情境写出一首诗,可以说明人工智能的水平吗?

 

我认为可以。
我是把认知等同于计算的, 我也认同说, 计算是重要的, 计算的载体是不重要的, 写诗如果仔细看起来, 一种受限创造, 在语言空间的即定规则下, 结合自身体验和要表达的情绪, 计算出一种相对新颖的既定语言组合。
这其中, 其实关系到几个东西, 一是需要分享的体验和情绪, 二是个人的独特视角和经历, 三是这种符合既定语言规则的组合能力。现在机器智能基本都在第三个框子里运作。这个框子, 看起来也是和智能最相关的部分。
我是认为这部分是完全可能机器化的。
但是人的诗歌之美, 和智能之美, 之所以是一种表达和沟通, 就在于, 是从能和即定的语言空间中, 让不同的人能够体味另一个个体的澎湃的情绪和体验, 在这一部分, 目前人工智能这边的相关工作相对比较少, 从实用性角度, 好像也比较少这种进行个体化建模的人工智能。

如果说有天人工智能能够写诗, 在目前的可能图景下, 我只能想象是一个具备自己独特内部状态(这个内部状态是有清晰的边界的, 可变化的)的人工智能,而且它能够将自己的内部状态和语言是能够相互对应的。在这种情况下, 机器也许能写出真正好的诗歌, 但是人类可能也不一定能够理解,因为人的内部状态是生物的, 而机器不是, 两个机器人写的诗歌, 可能在交流自己某个地方供电不足, 从而急需找电。 但是人缺乏这种内部状态, 不一定能够达到有效交流。
或者情绪上高度共鸣性交流。
而且, 这种个性化的拟人智能, 并不是目前AI发展的主要方向。
我想我大概想表达的观点就是, 诗歌不仅逻辑的, 而且是情绪的, 是人性的, 也是兽性的。认知是一种计算, 但是情绪和体验并不单纯是一种计算, 对人类来说, 这二者经常是目的本身。而不是为了一种达到目的的计算方式。或者计算载体。
我感觉你的问题激发出我很多没有语言化的观点。
我也非常开心, 感谢.

第二次讨论

chatbot这块目前基本可以有一个大致判断,受限域目的驱动的chatbot是有意义有价值的。开放域希望拥有真正的理解和智能是都是忽悠。
受限域之所以有意义和价值,一来上目标容易清晰定义,二来是对手遵守规则(因为对手也是有目的的),所以数据的分布相对比较固定和有限。在开放域中,世界知识,常识推理,长上下文记忆。等等各种问题都难以界定。所以目前的开放域的chatbot都只是在扮演。靠人类对chatbot的宽容和好奇在维持聊天。
你发那个bot和我之前看过的woebot咨询机器人很像, 但明显woebot的限定性比你的那个要强.
这里里面有一个困境,对话双方如果不是自由对话的话比较难产生intimacy.
因为机器对情绪,潜在动机等等东西的掌握是不行的, 所以我倾向认为目前的人机关系中的亲密基本还是一种人和物的关系。当然会有很多个案会喜欢往bot上移情。不过这个仍然在以往恋物的框架之类。根本上是一种自我关怀和自我对话。并且刻意的对外部世界的反馈与自我关怀不符的部分做选择性的忽略。

———————————————————
所以有点自说自话的感觉?那么另一种情况呢,人在机器的后面?比如社交软件,为什么我会对微信上的各种头像产生不一样的感觉。

 

是的,可能和读一本小说类似。它的交互形式和小说是不一样的,但是作用和关系是一样的。
对微信头像产生不同感觉这个其实就是和看不同颜色会有不同生理唤起道理有点像。有点像条件反射的弱化延伸版本。背后还是hebbian learning. 本来不同的意向就是会和不同的认知联系在一起的,而且微信头像往往还会和这个真实的人的很多东西相关。

———————————————————
感觉非定域的chatbot还是更有意思, 不把它往工程问题去理解,而是往戏剧,小说去理解, 就像你说的,类似于自我对话, 但比纯粹的自我对话又多一些趣味,毕竟还能挖掘了许多社交媒体的语料。不能解决工程问题,恰恰带给了它非工具性–某种意义上更像人.

 

对,还是有一定新信息的。没有经过整合的处理,只是单纯的新信息。不过你所说的非工具性、某种意义更像人,是指由于无能所带来的那种无奈感?

———————————————————
不是无奈感。就以我们在这个沙龙里的对话来说吧,本质上不是为了解决问题,不是要论证特定观点,参加者也没有说一定要获得特定的回馈,所以是沙龙中的对话是非工具性的。但大家在一个有关联的,自由的状态下聊天,既有发言又有倾听,所建立的关系,可能『更人性化』
一个chatbot或许也多少能带来这种『更人性化』的感觉。当然这里面需要人类很宽容,为它脑补很多

 

我比较怀疑你所说的这种状态在和bot对话时会不出现。不过这个我无法直接反驳你。因为我是做bot的,所以我在和bot对话时无法排除那种想拆开来看看的好奇样的机械感。不知道大部分人会是多少的代入感。
不过从一些关于siri以及小冰的报道来看, 似乎确实有人把bot当成日常的情感维系者.

———————————————————
我倒是天然地假设可以把bot当成感情对象..硅胶娃娃都可以嘛, 可能弄成一个用户长期留存的产品确实很难。做一个一小时的戏剧作品还行吧. 或者游戏npc. 虽然这些都是移情,但是其他种类的移情不涉及对话。

 

这个我倒是明白, 只是我无法从这个视角超脱出去. 我就是拿这种移情的观点看它的, 所以就没觉得它和其他种类的移情有什么不同.
我觉得游戏npc有时是让我感觉不太一样的. 是能代入到那种”人”的东西的.但是bot在我这儿的感觉基本就是一个物.因为那种瞄不准的时候太多. 那种意外的打偏会让我直接弃剧.

———————————————————
想象一下等待戈多那种现代话剧,完全可以让一个演员和一个bot来演, 要充分发挥人的脑补能力, 所以需要一个空间,让人一开始就接受打偏, 追求拟真会出现恐怖谷,但一开始就走卡通路线反而更容易有人味儿.

 

等待戈多那种也可以说是打偏吧, 但是那种打偏似乎意味深长, 所以吸引着你去琢磨琢磨. bot的打偏是那种一打偏, 你想去琢磨, 发现啥也没有.我看小冰的诗就是这种感觉.

———————————————————
嗯,其实我们说的和机器学习这种基于目标函数的思路可能不是一回事, 小冰是因为她的身份太简单了, 我是在想,怎么通过一系列场景的设置,让观众/使用者首先接受某种「打偏」,或者对不上戏路的时候, 可能有一些艺术家已经干了?

 

和目标函数什么的没关系, 咱们现在只谈目前bot的表现, 不谈它的实现机制.当然它之前有这么个表现, 是因为这种pretend to understanding的拟合机制所致.
我有点知道你的意思, 很多bot就是在用这种身份伪装, 在做一些讨巧, 假装自己比自己实际的本领更高.
刻意设置可能很难, 主要是这个打偏太无意义了. 等待戈多的打偏在我的理解中, 其实有点像指桑骂槐. 这和很多文学作品一样,虽然看似是无意义的混乱,但是内在是具有统摄的,偏得非常具有方向感的, 有点像有一个神枪手,打了十枪围着正圆心围成一个九环的圆,这此混乱相互引导,反而让你一下子就知道他想打圆心。圆心反而是最先让你认识到的东西。 但是bot的偏是混乱.它没有方向感. 它是均匀的散布在靶上,所以你看完后,没有意象统摄。没有意义。

———————————————————
很多现代艺术的生成方式更加混乱.

所以我完全不喜欢后现代的很多所谓艺术, 我在这方面比较极端, 认为这些东西就是挂艺术之名, 其实就是在售卖名气.你像那个马桶, 它有什么艺术可言, 它的价值完全是自生于自己这个系统的历史背景之下的.类似于在控诉, 在颠覆.它的所有价值就依附于那个它控诉的东西.它本身没有价值.

———————————————————
你说杜尚的小便池?通常认为现代艺术是把context引入了作品, 把观看方式引入, 我觉得还挺酷的。传统艺术没有这种自由感,也缺少思想上的批判能力.

 

对, 这一套东西我就觉得是不自然的的. 只给内部人交流使用.就好像是哲学中的语言学转向, 它的价值就依附于那些经典论断, 它只有在反对的时候才有所指.它本身w什么也没有, 当然语言学转向我觉得还是挺有价值的, 但是现代艺术就…

———————————————————
毕竟这个小便池也已经100年了. 感觉随机噪点不太可能支撑100年的现代艺术发展, 应该比 结构-解构 对立 还是更复杂一些。

我的第一个想法,是现代艺术把观众也当成了作品的一部分。经典艺术对观众有比较固定的假设,现代艺术其实在挑战,塑造观众, 现代艺术厉害之处在于,它已经成功地让自由被艺术垄断了。你再也不能严肃地说「这个艺术品没有满足xx标准」作为批评它的合理方式, 或者反过来,也不是满足了xx标准就一定是艺术.

 

我好像在这方面正好和你观点相反,我是觉得为了反结构就不要结构是不对的. 即使你承认说已经穷尽了所有结构, 走向随机性的噪点也不是个好去处. 当然, 我对现代艺术也了解不多. 只是反对那些瞎胡搞的艺术. 他们的作品的打偏就和bot的打偏是一样的.
小便池那个, 不可无一, 不可有二。经典艺术和现代艺术肯定都对观众有要求, 但是我不知道现代艺术对观众的期待是什么. 古典艺术期待的是细微的, 深沉的, 敏锐的某种人类情感. 但是现代艺术不知道在干什么. 总之我觉得需要有个标准, 一味的否定不是办法.

———————————————————
哎, 我去吃点肉去, 谈艺术谈得好饿.

bye.