网络舆情是怎么监测的？主要通过什么途径

如题所述

推荐答案 2017-09-25

数据源的获取是做舆情监测的第一步，有了米才能做粥嘛。从获取的方法上有简单的取巧办法，也有复杂到需要应对各类网站难题的情况。
方法大致如下：
使用搜索入口作为捷径
搜索入口有两类：一类是搜索引擎的入口，一类是网站的站内搜索。
做舆情监测往往是有主题、有定向的去做，所以很容易就可以找到监测对象相关的关键字，然后利用这些关键字去各类搜索入口爬取数据。
当然也会遇到反扒的问题，例如你长时间、高频次的爬取搜索引擎的结果页面，网站的反扒策略就会被触发，让你输入验证码来核实是否是人类行为。
使用搜索入口作为捷径也会带来一些好处，除了爬取门槛低，不需要自己收录各类网站信息外，另一个特别明显的好处是可验证性非常好，程序搜索跟人搜索的结果会是一致的，所以人很难验证出你获取的数据有偏颇。
爬虫根据网站入口遍历爬取网站内容
第一步要规划好待爬取的网站有哪些？根据不同的业务场景梳理不同的网站列表，例如主题中谈到的只要监测热门的话题，这部分最容易的就是找门户类、热门类网站，爬取他们的首页推荐，做文章的聚合，这样就知道哪类是最热门的了。思路很简单，大家都关注的就是热门。至于内容网站怎么判断热门，这个是可以有反馈机制的：一类是编辑推荐；一类是用户行为点击收集，然后反馈排序到首页。
第二步是使用爬虫获取数据。爬虫怎么写是个非常大的话题，在这里不展开说明，需要提一嘴的是，爬虫是个门槛很低但是上升曲线极高的技术。难度在于：网站五花八门；反扒策略各有不同；数据获取后怎么提取到想要的内容。
数据检索与聚合
数据获取下来后哪些是你关心的、哪些是垃圾噪声，需要用一些NLP处理算法来解决这些问题。这方面门槛高、难度大。首先大规模的数据如何被有效的检索使用就是个难题。比如一天收录一百万个页面（真实环境往往比这个数量级高很多），上百G的数据如何存储、如何检索都是难题。值得高兴的是业内已经有一些成熟的方案，比如使用solr或者es来做存储检索，但随着数据量的增多、增大，这些也会面临着各种问题。
通常对热门的判断逻辑是被各家网站转载、报道的多，所以使用NLP的手段来做相似性计算是必须的，业内常用的方法有Simhash或者计算相似性余弦夹角。有些场景不单单是文章相似，还需要把类似谈及的文章都做聚合，这时就需要用到一些聚类算法，例如LDA算法。从我们的实践经验来看，聚类算法的效果良莠不齐，需要根据文本特征的情况来测试。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://88.wendadaohang.com/zd/StaMBSKKaVgSMVtttg.html

其他回答

第1个回答 2017-09-25

网络舆情
主要是通过相关软件健康。
原理类似搜索引擎，自动抓取热度，关注度，舆论风向。

第2个回答 2019-04-12

舆情监测系统可以全面监测对新闻、论坛、微博、微信、客户端、贴吧、平媒、社交媒体、搜索引擎等媒体，舆情信息“一网打尽”。

把舆情搜集工作从繁重枯燥的人工劳动中解脱出来，不再一个网站一个网站的去看，一个帖子一个帖子的去甄别，一个关键词一个关键词的去搜索。发生舆情主动告知，而不是被动地到处去找，工作导航引导您完成日常舆情监测。

相似回答

网络舆情是怎么监测的?主要通过什么途径答：网络舆情监测是通过对信息的实时搜索抓取，通过网络搜索以及网上调查来监测的。网络舆情是社会舆情在互联网空间的映射，是社会舆情的直接反映。传统的社会舆情存在于民间，存在于大众的思想观念和日常的街头巷尾的议论之中，前者难以捕捉，后者稍纵即逝，舆情的获取只能通过社会明察暗访、民意调查等方式进行，获...

网络舆情是怎么监测的?主要通过什么途径答：做舆情监测往往是有主题、有定向的去做，所以很容易就可以找到监测对象相关的关键字，然后利用这些关键字去各类搜索入口爬取数据。当然也会遇到反扒的问题，例如你长时间、高频次的爬取搜索引擎的结果页面，网站的反扒策略就会被触发，让你输入验证码来核实是否是人类行为。使用搜索入口作为捷径也会带来一些...

网络舆情是怎么监测的?主要通过什么途径答：一般中文互联网大数据及新浪微博的官方数据为基础，采集新闻、报刊、政务、微博、公众号、博客、论坛、视频、网站、客户端等全网11大信息来源。舆情，指在一定的社会影响空间内围绕事件的产生、发展和变化，舆情不是对民意的简单规律概括，是作为参与者的公众对涉事方客体及其政策方向持有的社会综合态度。同时...

舆情如何监测和处理?答：一、舆情如何监测？1、全网舆情实时监测：借助舆情监测系统的实时监测功能，企业可以对全网舆情进行7*24小时监测，覆盖新闻媒体、社交媒体、主流门户网站、论坛、博客、微信公众号、抖音、快手等多个平台。当发现与企业相关舆情时，系统会在第一时间采集，并及时地推送给企业，快速浏览当前和过去在互联网上...

一文详解舆情监测系统怎么运作答：舆情监测系统是一种专门用来监控和收集互联网上公众对各种事件或话题的态度的工具，主要通过大数据分析与网络爬虫技术实现。舆情监测系统运作主要包括以下环节：一、数据收集舆情监测系统首先会通过各种网络渠道进行数据的收集，包括社交媒体、新闻网站、论坛、博客等。系统利用爬虫技术定时抓取这些网站上的内容，...

针对互联网上的各种舆情,舆情监测方法有哪些?答：1.?人工监测，通过人工对各大网站(比如新闻网站、论坛、帖子、微博、微信)开展搜索，通过关键词的信息量，人工判断筛选信息，但是该方法有大量的人工搜索工作，过于繁琐，可能会把重要的点遗漏。???2.?专业舆情方法:?采用专业的网络舆情监测系统工具，例如：五节数据的五节舆情网络舆情监测系统通过采用专...

如何监测网络舆情答：现在有很多网络舆情监测工具和平台可以选择，比如识微商情监测系统、鹰眼速读网系统等。不同的工具和平台有不同的特点和优势，需要根据自己的需求进行选择。三、收集数据选择了合适的监测工具和平台后，就需要开始收集数据了。一般来说，可以通过以下几种方式来收集数据：监测关键词：设置一些关键词，监测...

大家正在搜

网络舆情监测的要求网络舆情监测是干嘛的什么是网络舆情什么是舆情监测网络舆情是什么意思网络舆情监测 toom 网络舆情监测系统报价网络舆情中心是干嘛的网络舆情监测公司良心科技