PHPAnalysis是目前广泛使用的中文分词类,使用反向匹配模式分词,因此兼容编码更广泛,现将其变量与常用函数详解如下:一、比较重要的成员变量$resultType = 1 生成的分词结果数据类型(1 为全部, 2为 词典词汇及单个中日韩简繁字符及英文, 3 为词典词汇及英文) ...
分类:
Web程序 时间:
2014-06-15 09:39:46
阅读次数:
196
文章是作为初学者记录之用,没有学习过的同学可以借鉴一下,至于用过和高手嘛,就算了吧。仅是入门。废话不多说了,马上新建个项目,添加Entity Framework,这个词以下将用EF代替。本文使用的IDE为vs2012。我是新建了一个控制台项目,然后添加的EF,以后我会使用EF作为类库添加到项目中,但...
分类:
其他好文 时间:
2014-06-14 17:59:30
阅读次数:
222
/*
*Copyright (c) 2013, 烟台大学计算机学院
* All rights reserved.
* 作 者:马广明
* 完成日期:2014 年 6 月 7 日
* 版 本 号:v1.0
* 问题描述:电子词典
*/
#include
#include
#include
#include
using namespace std;
clas...
分类:
其他好文 时间:
2014-06-14 17:52:17
阅读次数:
209
开发两年之久,竟然不知道host这个词是什么意思。前些天有幸遇到了,就跟别人请教了。今天理絮一下。总比不知道强吧。白话来说宿主就是一些框架运行机制运行时需要依赖的平台。例如web开发常用的IIS,mvc,asp.net开发的网站等web项目,有要依赖于IIS才能正常运转。IIS就是这些web项目的宿...
分类:
其他好文 时间:
2014-06-14 15:42:46
阅读次数:
179
今天 Release 了 1.1。 主要是移植到了 window 平台, 无须安装,直接执行。 对 UI 又一次进行了设计,应该比之前好看多了。 加入了 生词本 功能,方便 学习外语。----------------------------------------------------------...
分类:
其他好文 时间:
2014-06-14 15:21:17
阅读次数:
242
简介
很多人都玩过一个游戏,通过限定次数的提问猜出对方在纸上写出的一个词,当然对方必须对我们的每一个猜测做出回应,通过一连串正确或者错误的判断,如果最终我们猜出了对方的那个词,那么我们就取得了胜利,决策树的工作原理就和这个游戏类似,看下面一个例子:
上面这张图就是一个典型的决策树,我们每天出门前要想一下今天是开车还是走路呢?首先看看窗外,下雨了吗?如果有再看看到底是雪还是雨?哇靠!是雪...
分类:
其他好文 时间:
2014-06-14 14:45:27
阅读次数:
833
Latent Semantic Analysis (LSA)也被叫做Latent Semantic Indexing(LSI),从字面上的意思理解就是通过分析文档去发现这些文档中潜在的意思和概念。假设每个词仅表示一个概念,并且每个概念仅仅被一个词所描述,LSA将非常简单(从词到概念存在一个简单的映射关系)
不幸的是,这个问题并没有如此简单,因为存在不同的词表示同一个意思(同义词),一个词表示多个...
分类:
其他好文 时间:
2014-06-14 11:04:45
阅读次数:
399
问题描述:将一句话拆分成单个字符,并且去掉空格。
package com.mylucene;
import java.io.IOException;
import java.io.Reader;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.tokenattributes.Ch...
分类:
其他好文 时间:
2014-06-14 09:22:17
阅读次数:
235
有个视频专门讲过这个爬虫,但是太罗嗦了,顺便整理下,而且到现在,360也不傻,已经进化了,采用原来的方式,多少有点bug,这个后面会说。正题如下:
语言:python2.7.6
模块:urllib,urllib2,re,time
目标:输入任意词,抓到其联想词
版本:w1
原理:在360搜索主页:http://www.so.com/,当你输入”科技“时,搜索框会列出相应的联想词或者短...
分类:
编程语言 时间:
2014-06-14 09:11:06
阅读次数:
1111