使用sphinx search测试中文搜索引擎【转发】

Submitted by neurta on Wed, 02/26/2020 - 12:54
以上是及时建立实时索引的python程序的主要部分。可以把它设置成后台一直运行的守护程序,也可以在crontab里面配置每隔几分钟运行一次。 索引的更新  静态的主索引如果只建立一次,实时索引的数据量会越积越多,对实时索引的搜索带来很大压力,所以我们要定时重新建立主索引,清理实时索引。 清理实时索引的程序可以参考上面建立实时索引的python程序。

一种基于SIFT和DDIS的智能立体仓库货物自动识别方法

Submitted by neurta on Mon, 02/24/2020 - 10:24
发明公开一种基于SIFT和DDIS的智能立体仓库货物自动识别方法,包括以下步骤:S1、采集待匹配货物图像,将待匹配货物图像进行预处理,得到预处理图像;S2、对预处理图像进行目标提取,得到匹配模板图像;S3、采用SIFT特征匹配法对匹配模板图像与图像库进行粗匹配,并进行匹配对数判别;S4、采用DDIS模板匹配法对无法识别的匹配模板图像与图像库进行精匹配。对仓库货物图像进行SIFT特征匹配与DDIS模板匹配方法相结合,能将复杂货物图像较准确地识别出来,通过对货物图像的预处理以及目标提取,减少了识别所需时间,满足仓库货物识别要求的实时性。

一种基于相关性分析的神经网络自组织遗传进化算法

Submitted by neurta on Mon, 02/10/2020 - 10:49
一种基于相关性分析的神经网络自组织遗传进化算法,构建初始神经网络,初始神经网络只包含输入层和输出层;采用BP算法训练网络,并记录训练日志数据;获取链接相关性,优化神经网络;复杂化神经网络;融合遗传进化算法迭代神经网络,输出最优神经网络模型。发明输出最优模型的迭代次数由于NEAT输出最优模型的迭代次数,输出最优的神经网络模型之前所进行的bp调节次数少于普通的bp神经网络所需要的调节次数,通过使用不同数据集进行相关实验对算法性能(准确率)进行验证,结果表明在分类问题发明的表现相当优秀。

一种基于数据挖掘和可视化的电网事故关联原因回溯方法

Submitted by neurta on Sun, 02/09/2020 - 09:43
发明涉及一种基于数据挖掘和可视化的电网事故关联原因回溯方法,属于智能检索领域,该方法包括以下步骤:s1:数据挖掘,S2:事故追溯检索,s3:结合词库关联规则展示追溯过程;发明再电力系统处于运行状态时,如果系统出现问题,保护装置的动作信息就会把故障的有关信息传送给调度中心,通过将故障信息导入到智能分析系统中,建立故障数据挖掘算法,可以对故障的数据进行分析,提取故障特征,再收集历史事故事件数据,再根据这些元素相关联的其他运行信息,进行网状拓扑展示,辅助调度人员进行事故事件数据,再根据这些元素相关联的其他运行信息,进行网状拓扑展示,辅助调度人员进行事故事件的调查,使之成为系统运行人员对电力系统故障进行快速判断和处理的依据

一种基于图像分割及动态阈值的字幕提取方法

Submitted by neurta on Sat, 02/08/2020 - 08:51
本发明公开了一种基于图像分割及动态阈值的字幕提取方法,包括步骤:s1、遍历视频内某一时段含字幕的视频帧,做轮廓查找和划定轮廓外部矩形边界的操作;s2、分析矩形边界的特征,获取字幕区域的位置;s3、取定间隔的视频帧,对所述字幕区域进行图像分割;S4、对分割后的图形进行灰度化处理,根据灰度图像的像素直方分布获取二值化的动态阈值;S5、基于前序步骤中获得的动态阈值进行图像二值化操作,突出字幕图形,消除噪声像素点;S6、根据所述的动态阈值以及二值化图像进行判断,对不包含字幕的图像进行忽略,仅对包含字幕的图像进行字符识别;s7、汇总识别结果去重去冗;最终获得按时间排序的字幕文本文件

一种基于互联网数据采集的情绪指数构建方法

Submitted by neurta on Fri, 02/07/2020 - 09:06
本发明公开一种基于互联网数据采集的情绪指数构建方法,包括如下步骤:步骤1,获取互联网数据中针对某项投资的关注程度;步骤2,构建正负情绪指标;步骤3,从公开市场获取当月ipo数量和当日股票价格波动两项指标;步骤4,根据如下公式计算市场投资情绪指数;市场投资者情绪指数=【A/(A+B+C+D)】关注程度+【b/(A+B+C+D)】

一种基于神经网络的智能病案文字识别的方法

Submitted by neurta on Thu, 02/06/2020 - 11:12
发明提供了一种基于神经网络的智能病案文字识别的方法,发明通过新设计的卷积神经网络模块和双层神经网络的结合,新的卷积神经网络模块能加深神经网络的深度,将卷积后的特征图进行双层双向神经网络的处理,充分考虑到图片每一切片之间的联系,随着神经网络深度的加深,不会产生梯度消失的问题,还能更好的提取特征,使得本识别算法在通用文本及病案文本的识别准确率上显著提高,特别是比现有的ocr识别病案的准确率高,准确度达到98.3%,其次,本发明的算法数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力,再有,本发明的数据集是通过真实病案数据制作的数据集,能够有效的消除背景的影响

基因关联分析的修正方法及修正装置

Submitted by Anonymous (not verified) on Wed, 02/05/2020 - 15:05
本发明公开了一种基因关联分析的修正方法及修正装置,其中,方法包括:获取新的样本的基因序列:生成新的原本:对所述的样本进行标签赋值,其中,将所述新的样本进行标签赋值,其中,将所述新的样本与预设的患病以及健康的样本进行比对,以确定所属类别并放弃或者保留;重复执行所述获取序列步骤,以得到满足预设条件的多个样本,并获取新的数据集以进行基于回归方程的似然比检验,该方法可以保持原有数据中内在的基因信息,同时不违背原有的统计检验框架,从而原有的统计检验方法也可以直接使用,提高修正的适用性和准确性,简单易实现。

一种基于改进的Apriori算法的机床故障预测方法

Submitted by neurta on Mon, 01/20/2020 - 10:02
通过对机床故障的预测分析,可以在一定程度上降低或者避免因机床损失,而造成的工业生成中的经济损失。目前已有的预防技术有传统方法和在线监测方法两大类,其中传统技术是指由技术人员定期或不定期的对机床的噪音、温度、转速等状态因素进行判断,推测机床的健康状态;而在线检测方法主要通过相关系统实时监控主轴电流、扭矩、振动、声音和温度等机床状态,将采集到的数据进行分析判断,从而推断机床健康程度。传统方法存在技术人员的专业能力的主观因素,无法保证准确性,可靠性差且效率低;而在线监测方法,实时性要求高,随着机床数据的不断增加,传统的集中式数据库技术会给网络流量和服务器带来一定的压力。