专业既然是机器学习,那工作肯定也是继续和数据打交道,那么问题来了,很多时候推荐算法和数据挖掘算法都是现成可用的,平台初建,重点还在数据过滤和抽取,怎样高效的抽取数据?
利用往常算法比赛中常用的字符串处理方法吗,omg,维护它是一个淡淡疼的忧伤。
那么,重点来了,正则表达式,干净利落。
模版如下:
//step1,set reg string
String r...
分类:
编程语言 时间:
2014-12-19 00:41:32
阅读次数:
265
功能说明:退出抽取式设备。语法:eject[-dfhnqrstv][-a<开关>][-c<光驱编号>][设备]补充说明:若设备已挂入,则eject会先将该设备卸除再退出。参数:[设备]设备可以是驱动程序名称,也可以是挂入点。-a<开关>或--auto<开关>控制设备的自动退出功能。-..
分类:
其他好文 时间:
2014-12-17 18:55:37
阅读次数:
169
前一篇介绍了仓储的基本概念,并谈了我对仓储的一些认识,本文将实现仓储的基本功能。 仓储代表聚合在内存中的集合,所以仓储的接口需要模拟得像一个集合。仓储中有很多操作都是可以通用的,可以把这部分操作抽取到基类中。 在Util.Domains项目中创建一个文件夹Repositories,这个文件夹...
分类:
其他好文 时间:
2014-12-17 18:06:10
阅读次数:
250
题目来源于POJ,是一道非常基础的动态规划题目。但是却耗费了我非常多的时间,时间复杂度也从N的三次方,降到N的平方,最后优化到0(n)才最终得以通过。
题目如下:
要求其实非常简单,已知给你a1,a2....an,总共n个数,要求你从中抽取出两个连续的子序列,当然,如题意所示,两个序列连续在一起也是OK的,然后将其中最大的序列和输出即可。
看到题目,第一想法非常简单,从n个数中选择一个数...
分类:
其他好文 时间:
2014-12-17 16:29:36
阅读次数:
229
如果说协同过滤中物品选择问题可以描述成“推荐相似用户喜欢的物品”,基于内容推荐则可描述成“推荐与用户过去喜欢的物品相似的物品”。因此,推荐系统的任务还是(基于用户记录)预测用户是否喜欢自己没有见过的物品。
基于内容的推荐,必须依赖关于物品和用户偏好的额外信息,但它不需要巨大的用户群体或评分记录,也就是说,只有一个用户也可以产生推荐列表。
在文本文档推荐中,比如新闻或网页,绝大多数的基本假设是物品的特征能够自动从文档内容本身或无结构的文本描述中抽取。因此,基于内容推荐系统的典型例子是比较候选文章的主要关键词和...
分类:
其他好文 时间:
2014-12-17 14:37:22
阅读次数:
902
文本特征提取
词袋(Bag of Words)表征
文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长度的数值特征向量而不是不同长度的文本文件。为了解决这个问题,scikit-learn提供了一些实用工具可以用最常见的方式从文本内容中抽取数值特征,比如说:
标记(tokenizing)文本以及为每一...
分类:
其他好文 时间:
2014-12-16 11:46:54
阅读次数:
203
1.java的注释单行注释//多行注释/* */javadoc注释 /** */(1.javadoc注释只能打在类和方法上2.javadoc可以抽取注释生成html文件3.命令格式 javadoc -d doc HelloWorld.java)(尚未完成操作???)2.包更好的定位类,把相同功能的类...
分类:
编程语言 时间:
2014-12-15 23:19:29
阅读次数:
289
重构那本书中,讲的比较理论化,从中摘取比较有用的部分,总结一下重构的几种手段,便于日后在项目中使用。第六章,重新组织函数: 把重复的代码或者公共的代码抽取成一个方法提炼出来。 设置临时变量问题,有的时候表达式太长的时候,要引入解释性变量,就是增加临时变量。 不需要临时变量的时候,要去掉,简化表达,让...
分类:
其他好文 时间:
2014-12-15 16:46:40
阅读次数:
154
什么是MyBatis
MyBatis是支持定制化SQL、存储过程以及高级映射的优秀的持久层框架。MyBatis 避免了几乎所有的 JDBC 代码和手工设置参数以及抽取结果集。MyBatis 使用简单的 XML 或注解来配置和映射基本体,将接口和 Java 的 POJOs(Plain Old Java Objects,普通的 Java对象)映射成数据库中的记录。
...
分类:
其他好文 时间:
2014-12-15 13:44:35
阅读次数:
146
什么是MyBatis MyBatis是支持定制化SQL、存储过程以及高级映射的优秀的持久层框架。MyBatis 避免了几乎所有的 JDBC 代码和手工设置参数以及抽取结果集。MyBatis 使用简单的 XML 或注解来配置和映射基本体,将接口和 Java 的 POJOs(Plain Old...
分类:
其他好文 时间:
2014-12-15 10:23:18
阅读次数:
237