教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 精品文档 > 实用模板 >

学术搜索系统中的学者论文搜索和相关论文推荐系统研究与实现

来源:网络收集 时间:2025-12-22
导读: 学术搜索系统中的学者论文搜索和相关论 文推荐系统研究与实现 答 辩 人 : 夏成银 指 导 老 师: 陆嘉恒 教授 专 业: 计算机软件与理论 2014/12/11 目 录 选题背景 相关工作 系统设计和研究方案 特色和创新点 参考文献 选题背景学术搜索系统 选题背景学术搜

学术搜索系统中的学者论文搜索和相关论 文推荐系统研究与实现

答 辩 人 : 夏成银 指 导 老 师: 陆嘉恒 教授 专 业: 计算机软件与理论

2014/12/11

目 录 选题背景

相关工作 系统设计和研究方案 特色和创新点

参考文献

选题背景学术搜索系统

选题背景学术搜索系统方面,国内外都有已经有一些系统,比如 谷歌学术、微软学术搜索、百度学术,它们在提供学术 资源检索等功能的基础上,都有各自的特色。 Google Scholar:依托于谷歌自身做搜索引擎的数据资 源优势,谷歌学术中可以搜索到世界上几乎所有的学术 期刊等学术资源。 Academic Search:在内容方面,Academic Search也 致力于提供学术资源对象级别的检索服务。 百度学术搜索:可以检索到免费和收费的学术论文,并 能够根据相关性、被引用次数和发表时间等进行排序。 ArnetMiner:对学者的社会网络等信息进行了进一步的 挖掘,某个学者的研究方向等更加深入的信息。

选题背景从上面可以看出,各个学术搜索系统除了提供学术资源检索等基本功能之外 ,都有自己的侧重点和特色。但是,由于学术搜索面向用户的多样性和国内 计算机学科发展的特点,关于学术搜索,仍然有大量的工作需要做。 不同层次的学者对计算机学术搜索系统的需求不一样,比如刚开始做研究 的学者想大致了解某个方向,而资深的老师想了解进一步的深入,想了解 某个领域最新的趋势。 对于国内的计算机研究人员,中国计算学会对于国际上的论文期刊有不同 的A、B和C等三个分级认定,这个分级相当于对某篇学术论文的质量和水 平做了一个比较客观的论断。通过该分级,国内的学者能够对某一篇论文 有一个大概的直观认识。

学术搜索系统中的学者论文搜索和相关论文推荐系统 计算机领域的论文、学者和单位搜索 计算机领域论文的CCF分级 DBLP论文数据的自动更新 相关论文的推荐

目 录 选题背景

相关工作 系统设计和研究方案 特色和创新点

参考文献

相关工作1、学术搜索系统 返回所有结果排序后的结果(Google Scholar) – 优点:返回的结果比较全 – 缺点:没有对结果进行整理,需要用户自己从 中寻找有用的结果 垂直搜索和对象级别的检索(Microsoft Academic Search)

– 是对库中的相关信息进行整合,抽取出需要的 数据进行处理后再以某种形式返回给用户。 – 提供面向资源对象级别的更加细化的检索 对学术社交网络中的信息进行进一步的挖掘 – Arnetminer

相关工作2、相关论文推荐 (1) 推荐算法 – 基于内容的推荐(Content-based recommendation) 分析所有待

推荐条目的属性特征进行推荐比如,一个电影网站中,给一个喜欢西部片的用户推荐属 于西部片的电影。

– 协同过滤(Collaborative filtering recommendation) 根据用户或者待推荐条目之间的相似性来进行推荐比如,在一个在线书店中,对于两个具有相似看书爱好的 用户,将一个用户喜欢的书籍推荐给另一个用户。

相关工作2、相关论文推荐 (2)论文推荐 – 问题:给定用户的兴趣信息,找出用户可能感兴趣 的其他相关论文。这里的用户兴趣可能是根据用户的浏览信息或者 是其他信息推断得来的。

– 常用方法:Citations,协同过滤,probabilistic topic modeling

目 录 选题背景

相关工作 系统设计和研究方案 特色和创新点

参考文献

系统设计和研究方案1、系统设计 (1) 系统架构图Offline数据爬取 元数据抽 取 数据增量 更新 数据存储 基础设施 论文推荐

Online搜索

相关技术: Boostrap、MongoDB、Python、Flask

系统设计和研究方案(2) 模块设计增量更新设计Paper Incremental Paper Incremental & Rank Update in DatabasePaper Pages Etc.

论文分级的确定Journals & Conference from DBLP Basic Paper Rank A: ACM Multimedia

DBLP Update Dectection

Data Incremental Parser

Booktitle & Journal

Scholar Incremental

Scholar Incremental

Final Rank

Paper Rank Dict

ACM Multimedia (1) ACM Multimedia (2) ACM Multimedia (3)

系统设计和研究方案2、相关论文推荐(1) 问题的定义给定一篇论文(计算机领域),找出和该论文相关的其它论文,供用 户参考。 输入:DBLP的论文数据(包含题目、作者、会议、期刊、年份等)、计算机领 域的学者信息(姓名、单位等)和其他从网络上爬取到的论文摘要等信 息。

输出:对于计算机领域的每一篇论文,找出和它相关的论文。

系统设计和研究方案2、相关论文推荐(2) 思路 1) 论文到论文的推荐根据现有论文的题目、会议、年份、作者和摘要等信息,抽取出 论文的特征信息。 对于每一篇论文,找出和这篇论文相关的其他论文。

2) 由作者到论文的推荐利用现有的学者数据,抽取出学者信息,然后对于每篇论文的作 者的研究方向进行建模,利用这些信息找出其它和这篇论文相关 的论文。

3) 将上面的两种结果进行综合,得到最终的推荐结果。

系统设计和研究方案2、相关论文推荐(3) 难点和挑战 如何基于现有的数据,抽取出有效表示论文内容的数据。 根据抽取出的论文特征数据,设计出有效的推荐算法 Similarity和Diversity的平衡 当有新的论文数据加入时,如何更新推荐的数据

目 录 选题背景

相关工作 系统设计和研究方案 特色和创新点

参考文献

…… 此处隐藏:933字,全部文档内容请下载后查看。喜欢就下载吧 ……
学术搜索系统中的学者论文搜索和相关论文推荐系统研究与实现.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wendang/2327261.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)