毕业设计(论文)题目: 毕业设计(论文)要求及原始数据(资料): 1.综述国内外网络爬虫技术研究现状; 2.深入了解网络爬虫与文字分析的相关技术; 3.熟练掌握网络爬虫爬取策略以及分析策略; 4.设计并实现针对网络新闻的爬虫程序; 5.深入分析与整合爬取到的网络新闻数据; 6.训练检索文献资料和利用文献资料的能力; 7.训练撰写技术文档与学位论文的能力。 |
毕业设计(论文)主要内容: 1.综述网络爬虫在大数据分析中的应用; 2.了解网络爬虫以及文字分析的相关技术; 3.熟悉网络爬虫的开发环境; 4.设计以网络新闻为目标的爬虫程序; 5. 学习研究文字分析的关键技术与编写网络爬虫的设计流程; 6.熟练掌握程序绘制分析结果统计图的技术; ctsb7.设计与遮蔽肩垫实现针对网络新闻爬取与分析整合的程序。 学生应交出的设计文件(论文): 1.内容完整、层次清晰、叙述流畅、排版规范的毕业设计论文; 2.包括毕业设计论文、源程序等内容在内的毕业设计电子文档及其它相关材料。 |
主要参考文献(资料): [1] 于娟,刘强. 主题网络爬虫研究综述[J]. 计算机工程与科学, 2015, 37(02):231-237. [2] 张红云. 6aaaa基于页面分析的主题网络爬虫的研究[D]. 武汉理工大学, 2010. [3] 张莹. 面向动态页面的网络爬虫系统的设计与实现[D]. 南开大学, 2012. [4] 张晓雷. 面向Web挖掘的主题网络爬虫的研究与实现[D]. 西安电子科技大学, 2012. [5] 奉国和,郑伟. 国内中文自动分词技术研究综述[J]. 图书情报工作, 2011, 55(2):41-45. [6] 许智宏,张月梅,王一. 一种改进的中文分词在主题搜索中的应用[J]. 郑州大学学报, 2014(5):44-48. [7] 欧振猛,余顺争. 中文分词算法在搜索引擎应用中的研究[J]. 计算机工程与应用, 2000, 36(08):80-82. [8] Batsakis.S, Petrakis E G M, Milios E. Improving the performance of focused web crawlers[J]. Data & knowledge engineering, 2009, 68(10):1001-1013. 风力摆控制系统[9] Pant.G, Menczer F. MySpiders:Evolve Your Own Intelligent Web Crawlers[J]. Autonomous agents and multi-agent systems, 2002, 5(2):221-229. [10] Ahmadi-Abkenari F, Ali S. A Clickstream-based Focused Trend Parallel Web Crawler[J]. International Journal of Computer Applications, 2010, 9(5):24-28. |
本文发布于:2023-05-24 15:11:57,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/112449.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |