網(wǎng)站首頁
醫(yī)師
藥師
護(hù)士
衛(wèi)生資格
高級職稱
住院醫(yī)師
畜牧獸醫(yī)
醫(yī)學(xué)考研
醫(yī)學(xué)論文
醫(yī)學(xué)會議
考試寶典
網(wǎng)校
論壇
招聘
最新更新
網(wǎng)站地圖
中醫(yī)理論中醫(yī)臨床診治中醫(yī)藥術(shù)語標(biāo)準(zhǔn)中國方劑數(shù)據(jù)庫中醫(yī)疾病數(shù)據(jù)庫OCT說明書不良反應(yīng)中草藥圖譜藥物數(shù)據(jù)藥學(xué)下載
您現(xiàn)在的位置: 醫(yī)學(xué)全在線 > 中醫(yī)理論 > 民間中醫(yī) > 正文:有關(guān)pdf資料的ocr,建議成立一個制作小組,大家請進(jìn)
    

中醫(yī)資料:有關(guān)pdf資料的ocr,建議成立一個制作小組,大家請進(jìn)

資料庫里的很大部分是pdf格式的,不便于摘抄,復(fù)制,更不方便傳播。
前些時(shí)間在做易經(jīng)類書籍的電子版,感覺集體合作的力量大的很,幾十萬字的書幾天就制作好了。

http://www。37tcm。net/forum/viewthread.php?tid=4564&fpage=1
http://www。37tcm。net/forum/viewthread.php?tid=4038
http://www。37tcm。net/forum/viewthread.php?tid=4532

上面幾個鏈接里wesleybb、古月等朋友已經(jīng)在做桂林古本傷寒論的工作

有時(shí)間的朋友,我們可以成立一個制作小組。把pdf文檔做成文本文檔。
這樣便于傳播,比如一張cdrom就足以容納所有有價(jià)值的內(nèi)容
請大家發(fā)表自己的看法
沒有意義,象支持、我頂、不錯之類的回帖就免了。

[ Last edited by 魚翔淺底 on 2005/12/10 at 11:20 ]
-----------可以的。你能告訴我制作的方法嗎?
我?guī)浊П緢D書正在等待制作后給大家分享啊。
-----------pdf直接ocr沒做過,我都是自己把書掃描成tif,剛才搜索到一些信息,貼出來供參考

軟件名稱 CajViewer

說明:CAJViewer 6.0全文瀏覽器是中國期刊網(wǎng)的專用全文格式閱讀器截至 2005 年 5 月為止的最新版本,是5.5的升級版本,修改了一些老版本中存在的問題,如:打印、顯示亂碼,部分KDH文件的瀏覽問題,同時(shí)新增加如下功能:圖書管理功能,支持單頁\連續(xù)頁瀏覽模式、知識元鏈接、自動滾動,文字編輯功能可將選擇的內(nèi)容發(fā)送到指定的Word文檔,頁面定位更加方便,支持書簽、注釋、高亮、直線,曲線、下劃線,刪除線和自定義知識元等八種標(biāo)注功能,并有專門的標(biāo)注窗口對它們進(jìn)行管理,可對標(biāo)注信息進(jìn)行編輯,方便的書架管理讓您更易于管理書籍,更加強(qiáng)大的搜索功能讓您更加容易查找到感興趣的文本,并且能迅速定位到文檔的相關(guān)位置,友好豐富的幫助功能必定使您更容易掌握這款先進(jìn)的產(chǎn)品。(OCR技術(shù)由清華文通授權(quán)使用)。

http://202.38.232.5/CAJViewer6.0_OCR.msi

使用步驟如下:

1。啟動該軟件。

2。打開PDF文件。

3。點(diǎn)擊軟件頂端一排按鈕中的“文字識別”按鈕。

4。用鼠標(biāo)選定你要OCR的PDF文字的范圍。

5。松開左鍵,等一下,文字結(jié)果就出來了。OCR的效果至少比別的自帶OCR的瀏覽器要好。


不知道管用不
-----------以我的經(jīng)驗(yàn),清華的OCR比不上微軟office2003自帶的OCR,還差不少呢。
-----------我們可以試驗(yàn)一下,哪個好用用哪個。多組織幾個朋友一起來。
鋸響就有末啊
-----------
Originally posted by 魚翔淺底 at 2005/12/11 00:21:
我們可以試驗(yàn)一下,哪個好用用哪個。多組織幾個朋友一起來。
鋸響就有末啊

支持你。應(yīng)該多多的比較一下。
-----------。。。。。。年底了,事情太多。最近俺怕是做不成試驗(yàn)了
-----------
Originally posted by wesleybb at 2005/12/10 17:07:
以我的經(jīng)驗(yàn),清華的OCR比不上微軟office2003自帶的OCR,還差不少呢。

微軟的今天我裝了,怎么識別不了。
老是跳出如下圖的咚咚!
叫我設(shè)置語言,我設(shè)置不了啊,老是這一個選項(xiàng)!郁悶!
是不是因?yàn)闆]裝掃描儀的緣故哦?
附件: 你需要登錄才可以下載或查看附件。沒有帳號?注冊
回復(fù)引用

舉報(bào)返回頂部

如原
  • 發(fā)短消息
  • 加為好友
如原當(dāng)前離線
閱讀權(quán)限
30 
積分
224 
注冊時(shí)間
2006/3/29 
最后登錄
2010/12/11 
在線時(shí)間
601小時(shí) 
精華
日志
主題
帖子
216 

中級用戶

中級用戶, 積分 224, 距離下一級還需 276 積分
9#
發(fā)表于 2006/6/5 14:01|只看該作者
  • <big id="kp10c"></big>

    1. Originally posted by 魚翔淺底 at 2005/12/10 12:49:
      pdf直接ocr沒做過,我都是自己把書掃描成tif,剛才搜索到一些信息,貼出來供參考

      軟件名稱 CajViewer

      說明:CAJViewer 6.0全文瀏覽器是中國期刊網(wǎng)的專用全文格式閱讀器截至 2005 年 5 月為止的最新版本,是 ...


      最近想做黃竹齋老"傷寒雜病論會通"上網(wǎng)查了一下pdf to ocr 也是發(fā)現(xiàn)CAJViewer這個軟件,用了一下,使用ftp上的pdf檔,ocr的效果還不錯,只是我不會簡體打字,我是ocr成繁體, 現(xiàn)己ocr了三分之一,初校完后再請大家來幫忙校對(可能會繁簡分開來校對),
      -----------非常不錯,此舉將消除偶等文本一族的大苦惱,謝謝樓主和出力的哥們
      ...
      醫(yī)學(xué)全在線 版權(quán)所有© CopyRight 2006-2046, MED126.COM, All Rights Reserved
      皖I(lǐng)CP備06007007號
      百度大聯(lián)盟認(rèn)證綠色會員可信網(wǎng)站 中網(wǎng)驗(yàn)證