一种基于互联网数据采集的情绪指数构建方法

Submitted by neurta on Fri, 02/07/2020 - 09:06
股票市场

申请人:硕橙(厦门)科技有限公司

从理论上来说,市场上投资者的情绪指数能够在一定程度上预测未来的价格,当月ipo数量、当月新增用户数量、当月股市波动情况等因素都能够从某一个侧面说明市场上的情绪。例如对某些关键词的语义分析、对于某些特征信息的再编译等,可以使用当月ipo数量,当月新增用户数量,当月股市波动情况等因素来构建市场情绪指数。

概述页面一般来说存储了一些发帖的基本信息,包括阅读量,评论数,股吧链接,帖子标题,作者,发表日期以及最后更新日期等。

基于网页得到的语义数据,通过语义分析领域通用的中文情感极性词词典使用sosa算法进行分析。该系统类似贪心算法。

由此构建情绪指数的指标中的第二个输入变量正负情绪指标(posnegsentiment),同时我们还能够从公开市场获取当月ipo数量(iponum),当日股票价格波动(volatility)两项指标,根据下列公式就能实时得出我们的市场投资者情绪指数:

股票实时收益=A*关注程度(Focus)+B*正负情绪指标(PosNegSentiment)+C*当月IPO数量(IPOnum)+D*当日股票价格波动(Volatility)+残差