Distant Supervision for Relation Extraction Without Labeled Data 从自由文本中进行关系抽取,是构建大规模知识图谱的重要方法。关系是一个「关系,实体A,实体B」这样的三元组,比如某人受雇于某组织,某人导演了某部电影,等等。 传统的自动关系抽取方法包括: 有监督的方法:对句子中的关系进行人工标注,然后抽取词法、句法、语义特征,训练有监督的分类器,对测试.... 查看详情
关于论坛网站中问题质量的研究 2014年的文章"Great Question! Question Quality in Community Q&A" 主要针对论坛网站中的问题质量进行研究。 在很多论坛网站中(比如:知乎、StackOverflow.com),问题的质量至关重要。高质量问题可以提高网站名气,给用户更好.... 查看详情
一种基于连接图的 Web 文档聚类方法 09年的文章“Efficient Clustering of Web-Derived Data Sets”提出了一种基于连接图的web文档聚类方法,该方法不仅在性能可与平衡数据集上的streaming clustering(流聚类算法)相媲美,而且在处理稀疏、非平衡数据集时也加高效。 1.Web数.... 查看详情
使用数据挖掘方法进行自动化聊天分析 在线聊天中实时的自适应反馈和学习有助于增强聊天系统的“意识”,07年的文章 "Towards educational data mining: Using data mining methods for automated chat analysis to understand and suppor.... 查看详情
虚拟参考咨询和即时通讯的比较 文章"Learning from Chatting: How Our Virtual Reference Questions Are Giving Us Answers" 通过比较图书馆的两种主要在线咨询方式:虚拟参考咨询(VR)和即时通讯咨询(IM),来指导图书馆提供哪种咨询方式可以更加高效地帮助.... 查看详情
Google 的混合式研究与开发方法 《Google's Hybrid Approach to Research》,这是 google 全球副总裁 Alfred Spector 和 google 研究主管 Peter Norvig 联合撰写的论文。关于 Peter Norvig,他是人工智能业界经典书籍《Artificial Intel.... 查看详情
我是谁?你想过吗? 当我有了对生死的思考的时候,就对死亡很恐惧。总是希望如果人能永生该多好。随着科技的不断进步,很多不可能的事情变为可能。克隆技术的出现让我们的身体的部分可以被替换。如果我们的身体大部分被替换了,那么我还是我吗。换句话说,如果我的所有记忆和思维模式,包括知识、技能、个性、记忆被移植到另外一个我的克隆身体.... 查看详情
基于网络搜索的知识库填充方法 目前公开的知识库中(比如:Freebase,NELL和YAGO),尽管数据量看似很大,但依然是高度不完善的。比如Freebase中,有70%的人出生地是未知的,有99%的人种族信息是未知的。Google在文章 Knowledge Base Completion via Search-Based Qu.... 查看详情
机器智能:强人工智能什么时候出现? 在遗传学、纳米技术和机器人技术革命中,最深刻的是机器人技术,它所涉及的非生物智能的创造超过了非增强性的人类。较高的智能处理定然会超过低智能处理,它将令智能真正成为更加强大的力量。 在GNR中,R代表机器人技术,我们都想了解的真正问题是强人工智能,也就是人工智能超越了人类。有几个原因可以解释为什.... 查看详情
Google 的大规模稀疏数据相似对查找算法 在大量数据中找出相似的数据,是一个常见的问题。最Naive的算法需要数据量的平方级别的计算时间,这在百万以上数据量上是不可忍受的。在实际应用中没有最佳解法,需要根据数据情况设计合适的算法。Google的“Scaling Up All Pairs Similarity Search”这篇论文适用于千万.... 查看详情