TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它...
分类:
其他好文 时间:
2014-09-24 19:29:07
阅读次数:
208
//转化字符串为原来字符串+该字符串出现的次数
void TransChar(char* str,int n,char* res)
{
int res_len=0;//结果字符串现有长度
int count =1;//当前字符出现的次数
for (int i=0;i<n;i++)
{
if (str[i+1]==str[i])
{
count++;
}...
分类:
其他好文 时间:
2014-09-24 12:03:06
阅读次数:
181
题目:数组中有一个数字出现的次数超过了数组长度的一半,找出这个数字。
解法1:将数组利用快速排序进行排序,因为数组中有一个数字出现的次数超过了数组长度的一半,则排序以后直接取得最中间的那个数字即可!
时间复杂度为:o(n*logN),因为时间主要花费在快速排序上面了!
public static int find1(int[] a) {
Arrays.sort(a);
int mi...
分类:
其他好文 时间:
2014-09-23 21:21:55
阅读次数:
213
要求: 随机生成50个数字(整数),每个数字的范围是[10, 50],统计每个数字出现的次数以及出现次数最多的数字与它的个数,最后将每个数字及其出现次数打印出来,如果某个数字出现次数为0,则不要打印它。打印时按照数字的升序排列。版本一:(使用数组实现)import java.util.Random....
分类:
其他好文 时间:
2014-09-23 19:06:15
阅读次数:
204
这篇文章将接着上一篇wordcount的例子,抽象出最简单的过程,一探MapReduce的运算过程中,其系统调度到底是如何运作的。情况一:数据和运算分开的情况 wordcount这个例子的是hadoop的helloworld程序,作用就是统计每个单词出现的次数而已。其过程是:现在我用文字再来描述下....
分类:
其他好文 时间:
2014-09-23 14:36:44
阅读次数:
227
题外话:一晃来到新公司四个月了,笔者已从JavaWeb开发转行做iOS开发了,基本上相当于完全从头开始吧!于是这几个月就忙于学习诡异的Objective-C和iOS了,项目比较忙一直没有时间把之前面试的题整理完。现在只有两道题还留有草稿,整理一下分享出来。...
分类:
Web程序 时间:
2014-09-23 01:57:43
阅读次数:
231
用给出的公式求出每个蘑菇的grade,求出现次数最多的grade。如果有多个grade出现的次数一样多,且还有其他的grade,则把这些出现次数最多的grade按升序输出;否则,输出“Bad Mushroom”。注意当方案数只有一种的时候直接输出这个方案。
程序乱搞。。。 用很难看的姿势A掉了。。。
#include "stdio.h"
#include "string.h"
int ...
分类:
其他好文 时间:
2014-09-22 20:02:23
阅读次数:
164
1 string msg = "大刀对单刀,单刀对大刀,大刀斗单刀,单刀夺大刀。"; 2 //判断这个字符串中大刀出现的次数,和每次出现的索引位置 3 int count = 0; 4 string keywords = "大...
分类:
其他好文 时间:
2014-09-19 23:53:46
阅读次数:
1311
因为预先不知道出现的单词列表,无法方便地排序并使用折半查找;也不能分别对输入中的每个单词都执行一次线性查找,开销太大-->O(n^n)。
所以考虑使用二叉树的数据结构(O(n*logn))来组织这些单词,实现如下:
-----
/*
* My practice of K&R 6.5
*
*/
#include
#include
#include
#include
#defin...
分类:
其他好文 时间:
2014-09-19 02:19:54
阅读次数:
223
这道练习题训练了:
1.结构体数组
2.二分查找
3.指针操作
----
都不难,但很基础,我觉得很好,做完了记到博客上来,题目见k&R,实现如下:
/*
* Practice of struct array. K&R 6-1
* @author : wusuopubupt
* @date : 2014-09-18
*/
#include
#include
#incl...
分类:
其他好文 时间:
2014-09-18 23:49:24
阅读次数:
292