特稿 | 当“清莲”遇上“九歌”:不信人间有此工?

梁乐萌 清华大学清新时报 2018-01-13

作者 | 梁乐萌

责编 | 梁乐萌

排版 | 娄紫奇


两军对垒:“九歌”遭遇“清莲”


久闻清莲诗社人才辈出,诚邀贵社参与这次比赛,与人工智能同台PK,一展才华。”2017年9月7日下午6点,清莲诗社现任社长任滋禾收到了这样一条微信。


发微信的是计算机系研究生会的吴利,意在邀请清莲诗社成员参加清华大学计算机系一年一度的智能体大赛。这一赛事是搜狗首席执行官王小川1996年在清华就读期间担任计算机系科协副主席时创办的,至今已举办了21届。“智能体大赛”最初的形式是由选手编写人工智能程序,通过程序控制角色对抗以决出胜负。近年来,随着人工智能的发展,大赛的对垒形式越来越多样化。


今年,他们希望邀请校园学生诗歌社团清莲诗社的同学现场作诗,与新近开发的人工智能诗歌生成系统“九歌”同台竞技,并由来自人文和信息科学两个领域的评委打分评判,一决高下。


“感觉还蛮有意思的,”任滋禾没怎么犹豫就答应了。事实上,这并非清莲诗社与“九歌”的第一次接触。


“九歌”是由清华大学自然语言处理与社会人文计算实验室开发的自动诗歌生成系统,主要研发者是计算机系孙茂松教授团队的矣晓沅、杨成等七名研究生和本科生。据矣晓沅介绍,“九歌”从2016年九月份开始正式研发,“熟读”诗歌超过30万首,融合多个专门为诗歌生成设计的模型,通过最新的深度学习技术实现“下笔如有神”般的诗歌自动生成。


2016年,研发团队曾邀请清莲诗社对“九歌”进行评测。在数百首混杂了人类和机器所作的诗中。“要我们从语言流畅性、逻辑性、连贯性和诗性四个方面给每首诗打分,类似于图灵测试吧”。任滋禾介绍说。图灵测试是检验人工智能成功与否的常用方法,当测试者难以分辨被测是人还是机器,人工智能即通过测试。


历时一年的开发改进,“九歌”在2017年9月正式上线,并作为最大的亮点被请上了11月23日的智能体大赛舞台。


合刃之急:你急我不急


作诗的三个主题在比赛前一周就已经确定好,分别是古风、现代和清华。


按照比赛规则,清莲诗社派出三名成员和“九歌”完成三场限时10分钟的现场创作。社长任滋禾和颜钱明、宋勰睿两名成员与“九歌”研发团队一起进入第二现场。三名诗社同学分别从三大主题中抽取一个小主题,同时进行创作,“九歌”则根据同学抽到的小主题连续生成三首。


“之前没觉得,写起来才发现十分钟真的太少了。”任滋禾回忆说,她抽到的是“清华”,该主题的要求是“古月堂”。她说,自己从来没有亲眼见过这个地方,除了钱锺书与杨绛在此相遇外,对它的风物、轶事一无所知,这大大限制了她的发挥空间。


经过一番周折,诗作完成,修改又颇费功夫。“身边贵系(计算机系的别称)小哥哥催了好几次,问我改完了没有,我说别急,不是十分钟嘛,小哥哥说,现在只剩一分钟了。”


最终,任滋禾在限时内完成了一首七言绝句:


堂堂日月往来频,

花事隔墙落复新。

一向多情成伫立,

百年之后是何人。


宋勰睿在“古风”主题下抽到了比较常见的“秋意”,但十分钟的时间对他来说同样相当紧张。他在旧作基础上,完成了一首五言绝句:


莺歌犹入梦,

雁影已难寻。

况复西风起,

飘零满客襟。


除了主题之外,这次比赛对格律同样有要求。规则限定,“古风”主题诗作为五言绝句,“清华”和“现代”主题为七言绝句,因为“九歌”目前还只会生成这两种格律。


两名诗社成员已经完成了诗作,颜钱明却陷入困境,他抽到的是“现代”主题下的“机器”小主题,无论在清莲诗社平日吟咏练习中,还是在前人诗词中,这个主题都太过罕见。当比赛工作人员提醒“还有一分钟”时,他只得了一句。


任滋禾和宋勰睿凑了过来,帮他一起作诗。宋勰睿写出了一二句,任滋禾写出了第三句,颜钱明的原句充当第四句,如此拼成一首七绝:


汽笛声声车马羡,

百年大梦到今终。

前人若问公输事,

不信人间有此工。


与三位同学的紧张相比,十分钟对于 “九歌”来说却显得绰绰有余。输入关键词五秒左右,系统便生成了一首诗作。半分钟不到,三首古体诗全部完成。


高堂月荡灯前夜,

小苑风生桂子香。

闻道古人归去晚,

不堪相对一窗凉。

当时机器谁能辨,

今日文章岂易求。

赖有故人诗句好,

不妨为我写离愁。

桂树摇寒影,

梧桐冷暮烟。

西风何处起,

吹笛雁南天。


“生成完之后我们就默默坐那儿,等着诗人写完。”矣晓沅笑着说。


智能体大赛的人机写诗环节由清华人文学院、计算机系各一位教师和来自北京大学学生诗词社团“北社”的一位同学担任评委。十分钟过后,清莲诗社三人与“九歌”研发团队一同走出第二现场。大屏幕上显示出匿名的六首诗作。


经评委评定,“九歌”的作品获得“最佳格律奖”,三位清莲诗社成员的作品获得了“最佳意境奖”和“最佳创意奖”。由机器写作的“古月堂”主题诗作以微弱优势获得了现场观众投票选出的“最佳人气奖”。


诗作展示,照片由清莲诗社同学提供


参加比赛的三位清莲诗社成员都表示,对自己十分钟内草就的诗作并不满意。“最后就交了这三首渣作,我们都表示没眼看。”任滋禾说,“这种比赛,时间越短,机器的优势就越大。”


“九歌”的主要研发者之一矣晓沅同样这么认为。对于最后的结果,他表现得相当冷静:“这一结果说明了机器目前生成的诗总体能达到业余水平,但是离真正的诗人还差很多。从质量上,我们的诗确实离诗社同学的作品还有不小距离。并且诗社的同学是在现场10分钟内临时创作,如果给他们充足的准备和思考时间的话,机器和他们的差距会更大。所以我们的系统还有很大的改进空间。


目前,“九歌”已经能够产生集句诗、近体诗、藏头诗三种体裁的诗歌。“实际上我们目前做的还非常初步。”矣晓沅说。下一步,他们会继续优化生成诗歌的质量,同时争取继续开发和诗歌相结合的应用。


风波未息:进步还是缺失?


在现场,人文学院老师和北社诗人迅速准确地判断出了人类的作品,但“九歌”的作品却迷惑了大部分观众。作为评委的计算机系老师也承认,“机器和人类的作品看不出来什么差别。”


“猜猜哪三首是机器写的,哪三首是人写的?”“太厉害了,真是分辨不出来呢!”智能体大赛结束后,搜狐网等媒体纷纷对这一事件进行报道,社交网络中弥漫着人工智能技术进步的狂欢。


《机械姬》剧照(图片来源于网络)


与此同时,一部分人却在从另一个角度看问题。


比赛结束当天,计算机系教授马少平在微博中发布这六首诗,请大家猜测哪些出自机器之手。《中国好诗词》冠军、人气选手李四维在微博下方尖锐地评论:“旧体诗词离今人很远了,问公众能不能区分人和机器写的诗,就跟问外国人能不能区分河南话和山东话一样。这样得到的结果,除了证明了我国基础教育中的古代文学教育很失败之外没有任何意义。


任滋禾对李四维的观点十分赞同,“尽管人类的作品也是劣作,但是不能区分两者只能说明国民传统文化教育实在缺乏。”她说,与优劣无关,诗词是不是人类所作,懂行的人一眼就能看出来。她给出了三个简单的判断技巧:意象堆砌的大概率是机器,语法奇怪的大概率是机器,用典的基本可以确定是人类。


智能体晚会大赛后,清莲诗社成员在微信群里热烈地讨论起了这件事。诗社同学普遍认为,“九歌”做到现在的程度已经非常不错,但它与人类的情感差距依旧存在,并且难以逾越。“乍看起来(九歌的诗)还有模有样的,”来自新雅书院的诗社成员陈潇宁认为,“但因为它并不知道自己在说什么,难免句与句之间、或者离得远一点的词之间不是很有关联。”


自动化系的张洵恺也认为,现有技术结构带来的常见问题是主题漂移。“(人工智能的)写作逻辑比较像这样:写下第一个词,然后控制住自己不要想任何理性的东西,完全凭直觉和语感往后跟词。”在与李四维的微博互动中,他提到自己曾尝试这种方法,除了打字速度不够快,“可以说是很模拟机器了”。


“机智过人”节目现场(图片来源于网络)


人们永远在为人工智能的新进展兴奋着。2017年3月,在中央电视台《机智过人》栏目上海新闻发布会上,“九歌”为栏目自动生成一首七言藏头诗,走红网络:  

  

机心造化本无私,

智略功夫巧笑时。

过客不须频眺望,

人间天上有新诗。


2017年12月,“九歌”再次登上《机智过人》栏目,与陈昂等青年诗人PK。作为节目嘉宾,图灵奖获得者、清华大学交叉信息研究院院长姚期智院士认为,它的成功研发代表人工智能在先进的方向迈进了很重要的一步。


与此同时,对于人工智能作诗的意义的质疑也一直未曾断绝。正如任滋禾所说:“一首诗之所以有意义,就是因为它是人写的。”


对于这一质疑,矣晓沅这样理解:“从科研的角度,要实现大家理想中的人工智能,让机器学会理解和使用人类的语言是至关重要的一步。在现实中,虽然目前(人工智能写诗的价值)主要还停留在娱乐,但是我们希望可以借助这一载体,一方面推动相关技术的发展,另一方面也引起人们对中国古典诗歌的关注,为古典诗歌的传承和发展贡献一份力量。”


“从机器生成的诗歌和人类创作的诗歌的对比中,很明显能看到人类作品特有的美,希望这样的对比能让大家认识到。中国古典诗歌中的情感和思想是无法替代的,无论何时都值得我们去学习和传承。”矣晓沅说。


点击阅读原文体验“九歌”软件





本站仅按申请收录文章,版权归原作者所有
如若侵权,请联系本站删除
觉得不错,分享给更多人看到

清华大学清新时报 微信二维码

清华大学清新时报 微信二维码