我给苍井空配了首诗。。。

史中 浅黑科技 浅黑科技 2018-10-12


浅友们大家好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你特别想听到谁的故事,不妨加微信(微信号:shizhongok)告诉我。




我给苍井空配了首诗。。。


文 | 史中



今年国庆假期的时候,中哥在家撸稿子。正在生无可恋心猿意马之时,突然手机邪恶地一震。


原来是一位盆友给我发来了一个超大的“码”。



不要误会,不是骑兵步兵那个“码”,是一个微信的小程序码。他告诉我说,这是前两天他们团队做的一个有趣的公益小项目,技能是:“百分百为任何图片配上一首骚极了的诗”。

(哦对了,这位老哥在华为云供职,日常工作是用人工智能造福人类。。。由于是个人关系,我就隐去他的名字,权且叫他“华哥”吧。。。)


纳尼,配诗?任何图片?骚极了??中哥性趣盎然,决定扫码试一试。


进去以后是这样的:



这第一张图片要上传神马呢?作为一个老司机,我觉得最有诗意的东西当属全中国宅男都热爱的


。。。

。。。

。。。



北京天安门。



马上上传!结果。。。



形不可传?什么鬼?


我给朋友回微信:你不是说任何图片么??你过来,我保证不打死你!!


他说哥,我们华为云有一项极屌的业务,就是内容审核。。。一般来说,所有图片都要先经过“黄暴政恐”筛选。谁知道你一上来就剑走偏锋。


好吧,我的错。。。剑走偏锋不行,那我来一个圆润的。



配诗结果马上粗来了


哎哟不错哦,“肌理细致骨血匀”,杜甫老湿敷吟得一手好湿。


如此这般,我再试一个不圆润的。


看起来,AI君对身材不予置评,只好说“手可摘星辰”了。这次是李白的诗。


那么,如果我直接上传李白呢?



用宋代文豪苏轼的《水调歌头》来描绘盛唐李白的狂傲,AI君有两下子啊~


上传杜甫呢?



它居然从《陌上桑》里找到一句,还毫无违和感。。。


好了,不闹了。我用这个小程序可是来做正事的!随便打开一个《新建文件夹》,用单身二十年的手速找到几个我的好朋友。



晏殊的词我不太熟,但是,感觉这句配上苍老师有一种莫名其妙的精准感。。。



我觉得吧,用来形容贵妃的诗,用在朝美穗香身上一点都没有违和感(话说我是不是暴露年龄了。。。)



看到这首诗,中哥滑落成为跪姿。李白老师的告诫,感觉好有道理。。。


洗完手,中哥坐在椅子上,越想越觉得,这么有趣的东西,应该写成科普文章分享给浅友啊。于是我抄起电话,给华哥播了语音过去,让他给我详细讲讲其中的原理。


华哥告诉我,这其实是他们华为云和国家图书馆合作搞的一个小程序。他们在其他项目上有合作,但是单就这个“配诗小程序”(官方名字叫“伯虎点AI”)来说,并没有神马商业目的,也没人从里面赚钱,大家图一个 Happy。


我知道有人已经跃跃欲试准备好各路图片了。不过,作为逼格驱动的浅黑科技,我得强迫你们看完我的科普,文章末尾再给你们小程序码亲身尝试。




一、AI 配诗,这事儿难吗?



华哥说,这是他们团队用了两周多的时间开发出来的,和华为云帮其他企业做的大项目相比,算是一个“课余作品”,谈不上特别难。


给一个图片配诗,主要分四步:



1、审核


要不是我提醒,估计你又忘了。杜蕾斯教导我们说:“安全是一切美好的前提。”


审核是一个挺有学问的技术。简单来说,就是根据一定的需求,把违禁的图片输入人工智能系统,让它能够“学习”,然后“认识”。下次如果遇到用户上传了类似的图片,就直接扣下。


本来这个“配诗小程序”就是习作,还是要低调为好。所以华哥他们在这个项目里把图片审核系统调整得很严。连“天安门”“人民币”这类擦边球都直接标记为“违禁品”。


当然,事在人为,这个内容审核系统的严格程度是可以调的。就跟美国电影的“PG”、“PG-13”、“R级”的分级差不多。(顺便普及个冷知识,广大浅友喜闻乐见的《黑客帝国》系列,是17岁以上才能看的R级片。。。周星驰的《功夫》《美人鱼》在美国也被评为R级。。。)


《美人鱼》被评为R级,可能是因为这个镜头。。。



2、找来样本


人工智能和人有很多相似之处,例如:你要想在高考考场上如驴得水,之前必须要做完山一样多的模拟题;人工智能要想搞清楚一张图片是肿么回事,也要暗地里学习大量的“样本”。


华哥说,华为云这套人工智能引擎,是用上千万张图片训练出来的。


多科普一句。这些图片可不是大风刮来的,它们大多来自华为云的客户(比如段视频App,比如图片网站)。由于云平台不能随便用客户的数据,所以他们还得和客户签订特别详细的数据使用协议。当然客户也很愿意配合,因为华为云用客户A数据训练出来的人工智能系统,自然能更好地服务客户A,并且,有时候因为贡献了数据,还能拿到华为云一些小小的折扣。


一千多万张样本图片,来的时候可不是“素颜”的。


每张图片都被工作人员打了标签。例如这张图


它的标签就可能是“猫”“窗帘”“室内”“困”。


如果说这每一张图片都是一道“模拟题”,那标签就是“标准答案”。人工智能就靠图片和它标签之间的绝对关联,才练出“识图”的神功。


华哥说,标签一般分三类:物品、场景、概念。


例如:桌子、椅子、树、云这都算物品;室内、港口、户外这算场景;现代、快乐、安静这算概念。


然鹅,这些样本可不是拿来就能用的,因为有些图片的标签是错的,也就是说模拟题的答案给错了。。。毕竟给图片做标签的是人,而人是极其不靠谱的,这也能原谅。


接下来就是第一个难关:怎么把标错的图片挑出去。


如果一张一张核对,他们核对到八十岁生日也未必能做完。所以他们采用的是抽样的方法。比如,抽出一万张图片,大家一起看其中有什么标注错误,有没有把阿猫标成阿狗,有没有把下面这二位标记成毕福剑和周杰伦。


然后,找到一些有共性的大的标注错误,批量剔除出去。这样筛查几轮之后,样本就“纯洁”多了。



3、训练


终于到了训练环节。


训练当然是一种技术,但我觉得它更像一门艺术。它有点像一个小伙子上山学武术,究竟是学少林还是学武当还是学峨眉崆峒,只有不断尝试才知道。


于是,接下来就是第二个难关:训练样本的“不平衡”。


简单来说就是,可能带有“狗”这个标签的图片有100万个(因为它常见,很多照片里都有);而带有“蜜獾”这个标签的图片只有几十张(因为它不常见)


蜜獾,就是天天和狮子豪猪干仗的那个“平头哥”,由于过于热爱打架,现在已经濒危了。。。


训练样本的不平衡,会造成人工智能“偏科”,直接结果就是也许会把平头哥认成狗,这怎么办呢?


华哥说,有四招:


1)如果某个标签的样本少,那就多找一些样本数据补充进来。

2)如果某个标签的样本实在太多,就删掉一些冗余的数据。

3)在训练模型里,强制“惩罚”过多样本的权重。

4)把样本量悬殊太大的标签分开训练。


华哥说,如果样本特别好的话,其实有个小一千张图片就足够训练一个标签了。例如要让机器认识“人”这个标签,最好就给他婴儿、儿童、年轻人、中年人、五六十岁的人、老人、男人、女人、黑人、黄种人、白人各种千奇百怪的组合,越是全面,机器学的越好,下次遇到一个没见过的图片,无论里面是高矮胖瘦黑白黄什么样的人,他都能认出来。



4、配诗


经过训练,这个人工智能系统已经“长大”了。给它一张没见过的图片,他就能试着根据经验自己打标签了。


这个时候,只要找到上千首诗,为这些诗匹配标签就好啦。


图片--标签--诗句


华哥告诉我,这种匹配一般是通过“自然语言处理”的技术。简单来说,就是从网上扒下来大量的诗句,输入到人工智能里,让它学习“人们提到这首诗的时候,一般还会说些什么”,通过这种方法就可以判断一首诗和哪些标签有关联。


举个栗子。人们可能在网上写道:每当我读到“举头望明月,低头思故乡”的时候,就会想起远在老家的父母。通过类似的文本,机器就能学会,这首李白的诗,很可能和“老家”“父母”有关。


说到这,基本上人工智能为图片配诗的技术就简单说明白啦。复习一下:


人工智能的攻城狮们把大量带有标签的图片放到人工智能里让它学习,使得这个人工智能系统看到新图片的时候,也能按照自己的“理解”给它打上标签。然后通过“自然语言处理”的方式,找到很多诗句和标签的关系。然后通过标签做匹配,左手拉着图片,右手拉着诗句,就能实现图片和诗句的配对啦。




二、人工智能除了给图片配诗,还能干嘛?



搞清楚人工智能配诗的技术之后,我问了华哥一个终极秒杀问题:


你们天天给图片配诗,谁给你们开工资?


他说,所谓一斑窥豹。你可知道?给图片配诗虽然只是娱乐,但是其中用到的人工智能技术可是邦邦硬的。这些技术可以在很多领域玩出各种骚操作。


说到这里,他给我列举了自己在华为云日常做的一些黑科技:



1、短视频推荐


既然图片可以打标签,那么由图片组成的视频当然也可以打标签。这种技术的一个最简单的应用场景就是“智能推荐”。


举个栗子:


人工智能系统可以给不同的视频打上各个明星的标签。有郭德纲的就标上郭德纲,有杨幂的就标上杨幂。这样一来,你作为一个用户,如果经常看带有“郭德纲”标签的视频,那就可以给你推荐更多“郭德纲”的视频。


当然不仅如此。如果你喜欢哪一类风格的音乐,特定类型的舞蹈,甚至喜欢哪个 BGM,App 都可以帮你自动推荐。


给我推荐的视频,可能是这一类:




2、图片搜索


他告诉我,华为云和中国图库网有一个有趣的合作。


中国图库网是一个挺大的图片站。很多摄影师都会拍摄一些不错的照片传上去,然后卖给需要的网站,收取费用。


每张照片在上传的时候,摄影师都要手动为图片输入标签,例如“烟花”“老人”“幸福”之类的。这样我在网站上搜索“幸福”这个关键词的时候,才会看到他的作品。


而摄影师要为每一张图片手动输入标签,时间一长很容易烦。这个时候,人工智能就起作用了。它可以自动识别这张图片里可能有什么标签,然后作为候选标签列出来,摄影师只需要在这五十个标签里直接勾选就行了,最多十几秒钟就能完成。


这样,在我们搜索图库的时候,也能更准确地找到想要的图片,节省很多时间。



3、打击盗版


有了人工智能识图的技术,可以直接催生一个应用,那就是“以图识图”——在网络上找到和这张图类似的图片。


这种看似平淡的功夫,有一个非常重要的用途:反盗版。



华哥说,网上各种图片中,其实有超过94%都是非法盗版的,把原图水印切掉,上面加一些字,或者改变长宽比,做些模糊,就很难被发现。


不过,有了人工智能识图,很多盗版图片都会被揪出来了。。。



4、工业检测


刚才举的例子都是互联网应用,其实人工智能在图像方面的技术还可以用在工业上。

比如他们华为云和某个工业企业合作,开发出了一套“黑科技”,用来监测工人们的姿势是否规范。


有一道工序,要求工人们必须使用夹具来夹取零件,但有的时候人们图方便,会直接用手拿。这个时候在旁边放一个监控摄像头,人工智能的图像识别技术就可以识别出画面里的人是不是使用了夹具。根据我们实地测量的数据,有96%的不规范姿势,人工智能都可以直接找出来。


他说。


另外还有一家企业有一道焊接管道的工序,但是焊接过程中,有一定的几率出现微小的瑕疵——接缝处留有缝隙。这个缝隙用肉眼是看不出来的,需要拍摄X光片。这个时候,人工智能就可以帮助人类质检师傅“看片子”,绝大多数的裂缝,人工智能就可以直接识别出来。


其实,很多技术在华为内部早已应用了。例如在华为的手机生产线上,就会用图像识别的方法,检查手机外观的微小瑕疵;华为内部的纸质单据,也用到图像识别的方式读取信息,比对签名等等。另外,华为自己的视频、阅读 App,也用到鉴黄之类的人工智能内容审核系统。


华哥还告诉我,他们正在用图像识别的方法进军医疗领域。


其实,一张张CT、X光片就是一张张图片。我们可以让经验丰富的专家医生为这些X光片“打标签”,标注出什么样的片子对应着什么程度的疾病。这样,一个新的病人来了,人工智能就可以使用专家医生的经验,判断病情,从而给年轻医生重要的提示。


别看只是提示,有些时候,这能挽救一个人的性命。


他说。


挂掉电话,再打开这个为图片配诗的小程序,我的心里充满了别样的情感。


华哥说他们做这个小程序没考虑太多,就是想告诉大家,人工智能其实没那么神秘,普通人也可以用。把自己拍摄的照片传上去,配上一首诗,不失为一种别样的浪漫。



想到这,我脑海里突然出现了一张图片。


那是乔布斯最喜欢的杂志《全球目录》,在最后一期的封底上配了一张乡间风景图片。乔布斯说:“那是一张清晨乡间小路的照片,就是爱冒险的人等在那搭便车的那种小路。照片上面写了两句话:Stay hungry,Stay foolish。”


我把这张图片裁下来,让小程序给它配了一句诗:



最后,是你们期待已久的小程序码时间!!!(图上有一个大大的华为云 Logo,就当看个广告支持下我这哥们吧。。。)


长按下面这张图,选择“识别小程序码”就行啦。祝你玩得开心~~




再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongok

或者关注微博:@史中方枪枪 @浅黑科技

不想走丢的话,你也可以关注我的公众号“浅黑科技”。



----点击图片阅读更多精彩文章----



----想看更多请点击下方阅读原文----





曾经曾海难为水

    本站仅按申请收录文章,版权归原作者所有
    如若侵权,请联系本站删除
    觉得不错,分享给更多人看到

    浅黑科技 微信二维码

    浅黑科技 微信二维码