2007年6月14日星期四

访问受限网站

1、推荐方法:利用P2PCDN网络访问

Coral
是一个采用P2P技术的CDN网络,只要在想浏览的UR L域名后加上.nyud.net:8090就可以方便地利用CoralCDN网络进行浏览,比如可以通过http: //zh.wikipedia.org.nyud.net:8090/ 浏览维基百科中文版,可以看到安替被封的blog,几乎所有被国内封锁的网站都可以通过这种方式访问,看来以后这种技术应该大力发展才好。

2
、利用Google自动翻译

http://translate.google.com/tran ... ://zh.wikipedia.org

慢是慢了点,不过终究可以访问。

3
、维基百科浏览器

访问以下网址即可:http://gollum.easycp.de/gollum/g ... p;l=zh-cn&wl=zh

4
、改动hosts文件

C:\WINDOWS\SYSTEM32\DRIVERS\ETC (windows
被安装在C盘时) 用记事本或写字板打开hosts无扩展名文件加入

145.97.39.132 en.wikipedia.org
145.97.39.132 zh.wikipedia.org
145.97.39.132 jp.wikipedia.org
145.97.39.132 upload.wikimedia.org

5
、维基百科专用代理服务器

可以使用145.97.39.130:80 - 145.97.132.140:80之间任意一个IP地址作为代理。这是wikimedia位于巴黎的服务器。但是请注意,这些代理只能用来访问wikimeida网站,其他网站不能访问。

6
、其他代理服务器

国内: 代理服务器网、代理中国

国外:http://www.stayinvisible.com/index.pl/proxy_list
http://www.freepublicproxies.com/page1.html
http://www.proxy4free.com/page1.html
http://www.findproxy.com/index.html
http://www.anonymitychecker.com/page1.html
http://www.publicproxyservers.com/page1.html
http://www.allproxies.com/page1.html
http://www.proxymania.com/page1.html
http://www.proxymatrix.com/page1.html
http://www.proxytester.com/page1.html

也可以用代理服务器软件搜索验证,象代理猎手等。

7
、我再补充一个 在线式代理服务器
http://server.cemsg.com/
在线代理,直接通过web访问受限网站,去网站上看了就知道怎么用了,很容易的。

2007年6月5日星期二

Java开源搜索引擎收集

Egothor
Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。


Nutch
Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎。在它的主页有中文详细的说明。


Lucene
Apache Lucene是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。


Oxyus
是一个纯java写的web搜索引擎。


BDDBot
BDDBot是一个简单的易于理解和使用的搜索引擎。它目前在一个文本文件(urls.txt)列出的URL中爬行,将结果保存在一个数据库中。它也支持一个简单的Web服务器,这个服务器接受来自浏览器的查询并返回响应结果。它可以方便地集成到你的Web站点中。


Zilverline
Zilverline是一个搜索引擎,它通过web方式搜索本地硬盘或intranet上的内容。Zilverline可以从PDF, Word, Excel, Powerpoint, RTF, txt, java, CHM,zip, rar等文档中抓取它们的内容来建立摘要和索引。从本地硬盘或intranet中查找到的结果可重新再进行检索。Zilverline支持多种语言其中包括中文。


XQEngine
XQEngine用于XML文档的全文本搜索引擎.利用XQuery做为它的前端查询语言.它能够让你查询XML文档集合通过使用关键字的逻辑组合.有点类似于Google与其它搜索引擎搜索HTML文档一样.XQEngine只是一个用Java开发的很紧凑的可嵌入的组件.


MG4J
MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引,通过使内插编码(interpolative coding)技术.


JXTA Search
JXTA Search是一个分布式的搜索系统.设计用在点对点的网络与网站上.


YaCy
YaCy基于p2p的分布式Web搜索引擎.同时也是一个Http缓存代理服务器.这个项目是构建基于p2p Web索引网络的一个新方法.它可以搜索你自己的或全局的索引,也可以Crawl自己的网页或启动分布式Crawling等.


Red-Piranha
Red-Piranha是一个开源搜索系统,它能够真正"学习"你所要查找的是什么.Red-Piranha可作为你桌面系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作为一个P2P搜索引擎,或与wiki结合作为一个知识/文档管理解决方案,或搜索你要的RSS聚合信息,或搜索你公司的系统(包括SAP,Oracle或其它任何Database/Data source),或用于管理PDF,Word和其它文档,或作为一个提供搜索信息的WebService或为你的应用程序(Web,Swing,SWT,Flash,Mozilla-XUL,PHP, Perl或c#/.Net)提供搜索后台等等.


LIUS
LIUS是一个基于Jakarta Lucene项目的索引框架。LIUS为Lucene添加了对许多文件格式的进行索引功能如:Ms Word,Ms Excel,Ms PowerPoint,RTF,PDF,XML,HTML,TXT,Open Office序列和JavaBeans。针对JavaBeans的索引特别有用当我们要对数据库进行索引或刚好用户使用持久层ORM技术如:Hibernate,JDO,Torque,TopLink进行开发时。


Aperture
Aperture这个Java框架能够从各种各样的资料系统(如:文件系统、Web站点、IMAP和Outlook邮箱)或存在这些系统中的文件(如:文档、图片)爬取和搜索其中的全文本内容与元数据。它当前支持的文件格式如下:
Plain text
HTML, XHTML
XML
PDF (Portable Document Format)
RTF (Rich Text Format)
Microsoft Office: Word, Excel, Powerpoint, Visio, Publisher
Microsoft Works
OpenOffice 1.x: Writer, Calc, Impress, Draw
StarOffice 6.x - 7.x+: Writer, Calc, Impress, Draw
OpenDocument (OpenOffice 2.x, StarOffice 8.x)
Corel WordPerfect, Quattro, Presentations
Emails (.eml files)

2007年6月1日星期五

六一

祝我们这些
表面风光,内心彷徨;
容颜未老,心已沧桑;
似乎有才,实为江郎;
成就难有,郁闷经常;
比骡子累,比蚂蚁忙,
比鸡起的早,比狗睡的晚;
比驴干的多,比猪吃的差;
比岳飞忠良,比赖昌星紧张
的老中青年!!