学术搜索系统中的学者论文搜索和相关论文推荐系统研究与实现
学术搜索系统中的学者论文搜索和相关论 文推荐系统研究与实现
答 辩 人 : 夏成银 指 导 老 师: 陆嘉恒 教授 专 业: 计算机软件与理论
2014/12/11
目 录 选题背景
相关工作 系统设计和研究方案 特色和创新点
参考文献
选题背景学术搜索系统
选题背景学术搜索系统方面,国内外都有已经有一些系统,比如 谷歌学术、微软学术搜索、百度学术,它们在提供学术 资源检索等功能的基础上,都有各自的特色。 Google Scholar:依托于谷歌自身做搜索引擎的数据资 源优势,谷歌学术中可以搜索到世界上几乎所有的学术 期刊等学术资源。 Academic Search:在内容方面,Academic Search也 致力于提供学术资源对象级别的检索服务。 百度学术搜索:可以检索到免费和收费的学术论文,并 能够根据相关性、被引用次数和发表时间等进行排序。 ArnetMiner:对学者的社会网络等信息进行了进一步的 挖掘,某个学者的研究方向等更加深入的信息。
选题背景从上面可以看出,各个学术搜索系统除了提供学术资源检索等基本功能之外 ,都有自己的侧重点和特色。但是,由于学术搜索面向用户的多样性和国内 计算机学科发展的特点,关于学术搜索,仍然有大量的工作需要做。 不同层次的学者对计算机学术搜索系统的需求不一样,比如刚开始做研究 的学者想大致了解某个方向,而资深的老师想了解进一步的深入,想了解 某个领域最新的趋势。 对于国内的计算机研究人员,中国计算学会对于国际上的论文期刊有不同 的A、B和C等三个分级认定,这个分级相当于对某篇学术论文的质量和水 平做了一个比较客观的论断。通过该分级,国内的学者能够对某一篇论文 有一个大概的直观认识。
学术搜索系统中的学者论文搜索和相关论文推荐系统 计算机领域的论文、学者和单位搜索 计算机领域论文的CCF分级 DBLP论文数据的自动更新 相关论文的推荐
目 录 选题背景
相关工作 系统设计和研究方案 特色和创新点
参考文献
相关工作1、学术搜索系统 返回所有结果排序后的结果(Google Scholar) – 优点:返回的结果比较全 – 缺点:没有对结果进行整理,需要用户自己从 中寻找有用的结果 垂直搜索和对象级别的检索(Microsoft Academic Search)
– 是对库中的相关信息进行整合,抽取出需要的 数据进行处理后再以某种形式返回给用户。 – 提供面向资源对象级别的更加细化的检索 对学术社交网络中的信息进行进一步的挖掘 – Arnetminer
相关工作2、相关论文推荐 (1) 推荐算法 – 基于内容的推荐(Content-based recommendation) 分析所有待
推荐条目的属性特征进行推荐比如,一个电影网站中,给一个喜欢西部片的用户推荐属 于西部片的电影。
– 协同过滤(Collaborative filtering recommendation) 根据用户或者待推荐条目之间的相似性来进行推荐比如,在一个在线书店中,对于两个具有相似看书爱好的 用户,将一个用户喜欢的书籍推荐给另一个用户。
相关工作2、相关论文推荐 (2)论文推荐 – 问题:给定用户的兴趣信息,找出用户可能感兴趣 的其他相关论文。这里的用户兴趣可能是根据用户的浏览信息或者 是其他信息推断得来的。
– 常用方法:Citations,协同过滤,probabilistic topic modeling
目 录 选题背景
相关工作 系统设计和研究方案 特色和创新点
参考文献
系统设计和研究方案1、系统设计 (1) 系统架构图Offline数据爬取 元数据抽 取 数据增量 更新 数据存储 基础设施 论文推荐
Online搜索
相关技术: Boostrap、MongoDB、Python、Flask
系统设计和研究方案(2) 模块设计增量更新设计Paper Incremental Paper Incremental & Rank Update in DatabasePaper Pages Etc.
论文分级的确定Journals & Conference from DBLP Basic Paper Rank A: ACM Multimedia
DBLP Update Dectection
Data Incremental Parser
Booktitle & Journal
Scholar Incremental
Scholar Incremental
Final Rank
Paper Rank Dict
ACM Multimedia (1) ACM Multimedia (2) ACM Multimedia (3)
系统设计和研究方案2、相关论文推荐(1) 问题的定义给定一篇论文(计算机领域),找出和该论文相关的其它论文,供用 户参考。 输入:DBLP的论文数据(包含题目、作者、会议、期刊、年份等)、计算机领 域的学者信息(姓名、单位等)和其他从网络上爬取到的论文摘要等信 息。
输出:对于计算机领域的每一篇论文,找出和它相关的论文。
系统设计和研究方案2、相关论文推荐(2) 思路 1) 论文到论文的推荐根据现有论文的题目、会议、年份、作者和摘要等信息,抽取出 论文的特征信息。 对于每一篇论文,找出和这篇论文相关的其他论文。
2) 由作者到论文的推荐利用现有的学者数据,抽取出学者信息,然后对于每篇论文的作 者的研究方向进行建模,利用这些信息找出其它和这篇论文相关 的论文。
3) 将上面的两种结果进行综合,得到最终的推荐结果。
系统设计和研究方案2、相关论文推荐(3) 难点和挑战 如何基于现有的数据,抽取出有效表示论文内容的数据。 根据抽取出的论文特征数据,设计出有效的推荐算法 Similarity和Diversity的平衡 当有新的论文数据加入时,如何更新推荐的数据
目 录 选题背景
相关工作 系统设计和研究方案 特色和创新点
参考文献
…… 此处隐藏:933字,全部文档内容请下载后查看。喜欢就下载吧 ……相关推荐:
- [实用模板]第八章:法国“新浪潮”与“左岸派”
- [实用模板]2021年北京上半年临床医学检验技师生物
- [实用模板]SAP GUI 7.10客户端安装配置文档
- [实用模板]2001年临床执业医师资格考试综合笔试试
- [实用模板]36机场工作实用英语词汇总结
- [实用模板](一)社会保险稽核通知书
- [实用模板]安全教育主题班会材料
- [实用模板]濉溪县春季呼吸道传染病防控应急演练方
- [实用模板]长沙房地产市场周报(1.30-2.3)
- [实用模板]六年级数学上册典中点 - 图文
- [实用模板]C程序设计(红皮书)习题官方参考答案
- [实用模板]中国证监会第一届创业板发行审核委员会
- [实用模板]桥梁工程复习题
- [实用模板]2011学而思数学及答案
- [实用模板]初中病句修改专项练习
- [实用模板]监理学习知识1 - 图文
- [实用模板]小机灵杯四年级试题
- [实用模板]国贸专业毕业论文模板
- [实用模板]教育学概论考试练习题-判断题4
- [实用模板]2015届高考英语一轮复习精品资料(译林
- 00Nkmhe_市场营销学工商管理_电子商务_
- 事业单位考试法律常识
- 诚信教育实施方案
- 吉大小天鹅食品安全检测箱方案(高中低
- 房地产销售培训资料
- 高一地理必修1复习提纲
- 新概念英语第二册lesson_1_练习题
- 证券公司内部培训资料
- 小学英语时间介词专项练习
- 新世纪英语专业综合教程(第二版)第1册U
- 【新课标】浙教版最新2018年八年级数学
- 工程建设管理纲要
- 外研版 必修一Module 4 A Social Surve
- Adobe认证考试 AE复习资料
- 基于H.264AVC与AVS标准的帧内预测技术
- 《食品检验机构资质认定管理办法》(质
- ABB变频器培训课件
- (完整版)小学说明文阅读练习题及答案
- 深思洛克(SenseLock) 深思IV,深思4,深
- 弟子规全文带拼音




