http://blog.csdn.net/abcjennifer/article/details/23615947文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无...
分类:
其他好文 时间:
2015-01-06 21:27:47
阅读次数:
221
深入浅出Hadoop Mahout数据挖掘实战(算法分析、项目实战、中文分词技术)适合人群:高级课时数量:17课时用到技术:MapReduce并行分词程序 Mahout涉及项目:Hadoop综合实战-文本挖掘项目 Mahout数据挖掘工具咨询QQ:1840215592课程介绍本课程主要涉及以下内容的...
分类:
其他好文 时间:
2015-01-05 12:52:24
阅读次数:
532
东北大学出品 ,纯C++编写,学术免费,开源 。系统特色1. 全部代码采用C++语言编写2. 达到了业内最好的分析性能3. 支持七大语言分析技术4. 可以被应用于研制基于深度计算的文本分析和文本挖掘等应用系统地址:http://www.niuparser.com/
分类:
编程语言 时间:
2014-12-19 00:32:13
阅读次数:
375
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它...
分类:
其他好文 时间:
2014-11-29 22:52:21
阅读次数:
315
Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点、十大目标)课程讲师:迪伦课程分类:大数据适合人群:初级课时数量:330课时用到技术:部署Hadoop集群涉及项目:京东商城、百度、阿里巴巴双十一史上最低价,从未有的折扣,详情请咨询qq:1840215592Hadoop实战视频教程免费...
分类:
其他好文 时间:
2014-11-10 15:12:18
阅读次数:
225
文本特征提取方法研究一、课题背景概述文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、...
分类:
其他好文 时间:
2014-11-08 15:11:24
阅读次数:
411
Hadoop大数据零基础高端实战培训系列配文本挖掘项目课程分类:大数据适合人群:初级课时数量:230课时+90课程更新程度:完成用到技术:部署Hadoop集群涉及项目:京东商城、百度、阿里巴巴咨询qq:1840215592大数据Hadoop实战视频教程就从最基础的Java语法、数据库、Linux讲起到..
分类:
其他好文 时间:
2014-10-29 19:49:34
阅读次数:
221
Hadoop大数据零基础高端实战培训系列配文本挖掘项目课程分类:大数据适合人群:初级课时数量:230课时+90课程更新程度:完成用到技术:部署Hadoop集群涉及项目:京东商城、百度、阿里巴巴咨询qq:1840215592大数据Hadoop实战视频教程就从最基础的Java语法、数据库、Linux讲起...
分类:
其他好文 时间:
2014-10-29 12:13:08
阅读次数:
186
使用用户打标签次数*物品打标签次数做乘积的算法虽然简单,但是会造成热门物品推荐的情况。物品标签的权重是物品打过该标签的次数,用户标签的权重是用户使用过该标签的次数,从而导致个性化的推荐降低,而造成热门推荐。
运用TF-IDF的思想可以对算法进行改进。TF-IDF(term frequemcy-inverse documnet frequency)是一种用于资讯检索和文本挖掘的加权技术。用来评估一...
分类:
其他好文 时间:
2014-10-09 01:49:57
阅读次数:
250
Hadoop大数据零基础高端实战培训系列配文本挖掘项目大数据Hadoop实战视频教程就从最基础的Java语法、数据库、Linux讲起到深入Hadoop大数据技术所必须的所有知识,设计Hadoop生态圈所有常用组件,包括但不限于:Greenplum数据库、HBase、Hive、Pig、ZooKeepe...
分类:
其他好文 时间:
2014-09-18 14:33:03
阅读次数:
267