- 博客(10)
- 资源 (3)
- 收藏
- 关注
原创 经典信息检索模型(一)
经典信息检索模型(一)一.布尔模型:布尔模型是基于集合理论和布尔代数的一种简单的检索模型。由于集合的概念非常直观,所以布尔模型为信息检索系统的普通用户提供了一种易于掌握的框架,此外,查询被表示成有确切语义的布尔表达式。由于布尔模型内部简单,形式简洁,在过去的几年的几年引起了人们广泛关注,并且在早期的许多商业系统中得以采用。布尔模型假定标引词(关键词)在文献中要么出现要么不出现,因此标引词的权值全部被设为二值数据,Wi,j∈{0,1},查询词q由连接词not,and,or连接起来的多个标引词所组成。这样,查询
2010-09-06 22:07:00
8415
原创 中文分词与搜索引擎
<br />看到题目就知道我要说什么了,这个话题好像已经被讨论过n次了,看雅虎搜索blog上在06年就有过专题系列文章,地址为:http://ysearchblog.cn/2006/07/post_16.html,文中详细的介绍了有关中文分词的意义,算法,跟搜索引擎的关系等等。个人认为文章质量非常不错。其实我所写的也不外乎这些东西,可我为什么还要写呢?是因为我花了将近一周的时间来理解中文分词,收集有关资料,为了不让努力白费,我还是总结一下吧。<br />一.为什么要中文分词?<br />对啊,为何要分词,不
2010-08-29 03:59:00
12852
原创 重定向输出
[test @test test]# ls -al > list.txt 将显示的结果输出到 list.txt 档案中,若该档案以存在则予以取代![test @test test]# ls -al >> list.txt 将显示的结果累加到 list.txt 档案中,该档案为累加的,旧数据保留![test @test test]# ls -al 1> list.txt 2> li
2009-11-18 16:46:00
754
原创 关于路径搜寻的问题!为何不执行目前所在目录下的档案?
以下内容摘在鸟哥的linux私房菜,看了怕忘了,呵呵,在这里记一下…… 关于路径搜寻的问题!为何不执行目前所在目录下的档案?咦!刚刚不是提到『.』与『..』吗?那么那个『 . 』是干嘛用的?!眼尖的朋友应该已经发现了,就是『我在执行档案的时候,基本上,并不会主动搜寻目前目录下的档案』举个例子来说,我安装的squid 这个执行档在 /usr/local/squid/bin/
2009-11-18 16:35:00
769
原创 ubuntu 9.10 开启tty中文支持及分辨率修改
Ubuntu9.10出来了,于是乎赶紧试用,直接把以前的版本格了,重新安装了下。为了让tty支持中文,我首先 安装了 zhconsudo apt-get install zhcon 安装之后 ,ctrl+alt+f1切换到tty,运行zhcon --utf8,结果花屏,并且键盘错乱,没办法,重启下。重启后 ,运行zhcon --utf8 --drv=vga 不再出现键盘错乱
2009-11-07 21:25:00
4476
原创 [学习笔记]接口的作用
接口,规范,解耦合代码如下:package com.iceheart.action;interface SwitchableDevice{//具有开关的相关设备 boolean isOn(); void change();}class Light implements SwitchableDevice{ private boolean state = true;
2009-10-28 19:18:00
599
原创 简单的选择排序算法
最近在学习算法,呵呵,记录一下,省得忘了 选择排序:假设是对一个整型数组按照升序排序{ 10, 9, 20, 8, 45, 55, 74, 48, 45 };那么首先遍历一下数组,找出最小的一个元素,放到第一个位置(跟下标为0的元素交换)然后遍历剩余的元素,再找出最小的来放到剩余元素的最前面,依次进行下去。代码如下://=========================
2009-10-28 10:22:00
501
原创 sizeof运算符计算数组长度
size_t length = sizeof(array)/sizeof(*array); 这样计算出数组的长度,但是有个例外的情况,就是数组作为形参传递给函数的时候,时间上传递的只是数组的首地址所以sizeof(array) == 4例如:void foo (int array[]){ cout<<sizeof(array)<<endl;} 这时输出的值为
2009-10-28 09:51:00
1111
原创 统计数字问题
问题的描述:一本书的页码从自然数1开始顺序编码到自然数n,书的页码按照通常的习惯编排,每一页码都不含前导数字,例如,第六页用数字6表示,而不是06,或者006等,数字计数问题要求对给定的书的页码n,计算出书的全部页码中分别用到多少次数字,0,1,2,3,4,...,9。 初学算法,没什么高深技巧,采用穷举大法,代码如下:
2009-10-28 08:49:00
640
原创 转换为大些字母
char MakeUpperCase(char ch) { if (ch z) return ch; else return static_cast(ch - a + A);}
2009-10-27 23:22:00
476
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人