第623期机器学习日报(2016-06-02) 优质语料

好东西传送门 2016-06-03
温馨提示

点击文章底部【阅读原文】或【Read more】查看链接可点击的在线版本

机器学习日报 2016-06-02

  • 优质语料:联合国平行语料1.0版,包括阿英西法俄中六种语言,共15个语言对,每种1500W以上

  • 深度学习与自然语言处理(斯坦福cs224d)

  • 讨论:机器学习专家与统计学家观点上有哪些不同?

  • 什么是数据科学?如何把数据变成产品?

  • #ACL16#神经机器翻译(neural MT)长文8篇+短文3篇


用日报搜索找到以前分享的内容: http://ml.memect.com/search/

陈博兴-NLP   2016-06-02 22:20

资源 自然语言处理 PDF 数据

联合国平行语料1.0版发布,包括阿英西法俄中六种语言,总共15个语言对,语料包含了1990-2014年的数据,规模都在1500万个句对以上。 下载 网址: http://t.cn/R5bHcqg 论文: http://t.cn/R5bHcqe@好东西传送门



爱可可-爱生活   2016-06-02 20:27

经验总结 深度学习 自然语言处理 博客

《深度学习与自然语言处理(斯坦福cs224d)》by 寒小阳, 龙心尘 Lecture1:http://t.cn/R5bXEUf



老师木   2016-06-02 10:23

统计

【机器学习专家与统计学家观点上有哪些不同?】 saizheng:搞统计的人入ML的行,许多都会从Probably Approximately Correct (PA... http://t.cn/R5bhLjT



电商行业   2016-06-02 08:30

Hal Varian 数据科学 统计

【干货 :什么是数据科学?如何把数据变成产品?】据哈尔•瓦里安(Hal Varian)说,统计学家是下一个性感的工作。五年前,在《什么是Web 2.0》里蒂姆•奥莱利(Tim O’Reilly)说“数据是下一个Intel Inside”。但是这句话到底是什么意思?为什么我们突然间开始关注统计学和数据?



学生古   2016-05-26 11:55

会议活动 算法 自然语言处理 ICLR 会议 活动 机器翻译 神经网络

#ACL16#神经机器翻译(neural MT)长文8篇+短文3篇。除了一篇长文,其余10篇均已放出arXiv,有的已被引5次,有的来自ICLR16研讨会。关键词有:Character Word-character Monolingual Risk Coverage Subword Semi-Supervised Attentional Syntactically Vocabulary。 (以下是Github Markdown格式的论...全文: http://m.weibo.cn/2536116592/3979352070871737



关注“好东西传送门”,可以添加公众号awesomeport

 
点击【阅读原文】或【Read more】查看链接可点击的在线版 
↓↓↓↓↓↓  

觉得不错,分享给更多人看到