列一些没用的网站们~

阿托7:收集西音史材料时整理的工具网站,也许可以面向欧洲历史文本(20世纪之前)的查找和阅读

阿托7:机器是死的,人是活的

一、文本识别类

1. New OCR

链接:https://www.newocr.com/

  • 多语种OCR(标准122种语言),支持Fraktur字体(自动将ſ写为s)
  • 无次数限制
2. Online OCR

链接:https://www.onlineocr.net/

  • 多语种OCR(46种语言),不能识别Fraktur字体
  • 单文件大小上限15M
  • 每小时最多15份文件
3. Online OCR Converter

链接:https://onlineocrconverter.com/

  • 支持URL导入文件
  • 多语种OCR(标准122种语言),支持Fraktur字体(保留长ſ,似乎正确率比New OCR低)
  • 单文件大小上限15M
  • 每天最多5张图片
4. Transkribus Lite

链接:https://transkribus.eu/lite/

  • 基于AI的手写识别(也可以识别印刷体)
  • 若不注册,则在https://readcoop.eu/transkribus/?sc=Transkribus页面中也可以试用,但可用模型有限
  • 注册后,免费额度相当于PyLaia引擎识别手写页面约500张HTR+引擎约400张(若识别印刷页面则相当于约3000张PyLaia约2500张HTR+)
  • 多语种,可选择需要的预训练模型
*5. Old German typewriter

链接:https://archivfuehrer-kolonialzeit.de/index.php/font-tool?sf_culture=en

  • 非识别网站,用于古德语手写体(Kurrentschrift)的参考和比对
  • 包含六种手写字体的字母和常见连写,可以用来人工确认AI未能正确识别的文本,因此字体熟悉后可以不再参考

二、多语种词典类

1. Lingea – Dict.com

链接:https://dict.com/

  • 34种语言,可选择元语言(释义语言)
  • 支持全文搜索、通配符等高级搜索(但不太好用)
  • 可搜索变化词形,即自动识别含有格、数等屈折变化,找到其基本形式
  • 每种语言对为一本词典,内容为人工维护,因此词量及义项量可能不够全面
  • Premium版词典词量更大,但需购买
2. European Dictionary Portal

链接:http://www.dictionaryportal.eu/en/

  • 外部在线词典的链接门户,48种语言(未计4种手语),收录百余外部词典网站
  • 可根据目标语言和元语言筛选所需词典,但有些语言对的词典可能不存在(如无匈牙利语-英语词典)
  • 包含一些地方语种和历史语种,但数量分布不均,常见语言的词典更具多样性
  • 按词典分类,主要包括通用词典、专业词典、词源词典、历史词典等,因此可能有部分词典在词量上和专业度上更占优势
  • 部分词典需要登录
3. Wiktionary

链接:https://en.wiktionary.org/

  • 不需选择目标语言,在同一单词下列出该词在不同目标语言中的义项
  • 开放维护,语言数量多,词量较大,释义较全
  • 全文搜索的方式查找变化词形

三、历史资料、图书馆类

阿托7:虽然列出以下网站的目的主要在于查找历史报刊,但其中一些网站用处更广

阿托7:对于报纸而言,很难用一个网站完整索引一个国家的所有在线报纸档案库;一些未能在门户或列表中收录的地方报纸,则需要自己在其所在地的图书馆电子资源中尝试查找

阿托7:由于成本原因,一些地方图书馆可能没有资金进行大规模电子化,或者电子化的报纸数量有限,因此一些所需报纸可能确实无法在线上获取

1. EuroDocs

链接:https://eudocs.lib.byu.edu/

  • 杨百翰大学建立的索引网站,提供欧洲史相关在线资源的网站链接
  • 按国家和时间索引,所涉材料领域比较全面,类型丰富,但具体到各类资源自然难以做到完整
2. List of online newspaper archives

链接:https://en.wikipedia.org/wiki/Wikipedia:List_of_online_newspaper_archives

  • 维基百科页面,按国家列出在线可访问的历史报纸和杂志档案库
  • 涵盖范围较广,但不少档案库均需付费,且时间更侧重二十世纪
3. Europeana

链接:https://www.europeana.eu/

  • 欧盟建立的门户网站,旨在为欧洲的电子化文化遗产提供聚合搜索和浏览
  • 整合了欧洲3000余所图书馆、艺术馆、博物馆等机构的电子收藏(包含部分IMSLP)
  • 包含艺术、手稿、音乐、报纸、图像等十余个大类
  • 可以在所有合集中搜索,也可以在各大类中分别搜索,但所得结果可能不完全一致
  • 整合的机构有限,且同一图书馆可能仅收录了一小部分内容,甚至不能返回一个图书馆中的所有结果(因此可以访问返回结果中的图书馆,再在其电子资源中逐个查找,以获得最多数量的结果)
4. The European Library

链接:https://www.theeuropeanlibrary.org/

  • 非网站链接门户,仅列出欧洲48个国家图书馆和主要研究型图书馆的名称(甚至没有链接)
  • 该网站最初提供聚合搜索,但于2016年终止服务,并转由Europeana维持运行,该网站仅保留图书馆列表
  • 与Europeana同理,可以逐个单独访问该站列出的图书馆,在其中查找电子资源(国家图书馆一般会整合该国的电子化材料,但未必足够全面,且可能没有在线访问权限)
5. LibWeb

链接:http://www.lib-web.org/europe/

  • 欧洲(实际上是全球)各地公共、学术和学校图书馆的链接汇总,(至少在欧洲范围内)覆盖比较充分
  • 便于按地区找到该地的主要图书馆
  • 并非所有图书馆都会提供大量电子资源,也不一定对本地历史资料进行电子化处理,囿于成本限制几乎都不支持全文搜索(但总归可以一试)

四、辞典类

阿托7:音乐家生平为主要关注点,所列主要为传记辞典

阿托7:了解生平首先当然是找维基,有时英语维基上没有的条目可能在其它语言下存在,页面列出的参考书目可能是个不错的出发点;有时IMSLP页面上部也会提供一些简单的生平信息

阿托7:在辞典的编写过程中,后来出版的新版本虽然会对一些条目进行扩充,但同样也经常删除一些当代价值不大或者过于冷僻的条目;由于多数大型传记辞典的初版年代都较早,已过版权期,因此可以考虑在更早期的版本中尝试查询相关信息

1. Deutsche Biographie

链接:https://www.deutsche-biographie.de/

  • 德语区人物传记
  • 主要数据库为ADB和NDB,也整合了不少外部传记辞典(如BLKÖ)
  • ADB和NDB中存在的词条内容直接显示,外部辞典则提供链接
  • 同时提供相关的档案库和图书馆等链接,有时也会列出该传记词条的参考文献
2. Biographie-Portal

链接:https://www.biographie-portal.eu/

  • 德语区人物传记门户网站
  • 与Deutsche Biographie存在部分重叠(如ADB和NDB),但也收录了另外7个传记辞典数据库
  • 资料丰度不如前者,只有指向辞典的外链,无其它图书馆等数据库链接
3. Biografický slovník

链接:http://biography.hiu.cas.cz/

  • 捷克人物传记辞典BSČZ的在线版,2004年开始出版,现已出版A至Hi,预计以一年一卷的速率更新
  • 全文免费,由于尚未出版完全,条目有限,且数据库更新较纸质版出版延后约一年
4. Dansk biografisk Lexikon

链接:https://biografiskleksikon.lex.dk/

  • 丹麦传记辞典DBL,线上为该书的第三版(16卷)
  • 全文免费,但第三版较之第二版(27卷)有删减,与之类似的辞典还有同网站上的Den Store Danske(https://denstoredanske.lex.dk/),可以互相参考
5. Dizionario Biografico degli Italiani

链接:https://www.treccani.it/

  • 意大利传记辞典,与其它诸多意大利百科全书等资源一起整合在Treccani Encyclopaedia中,以上链接即为Treccani的总链接,词条总数可观
  • 全文免费在线
6. Svenskt biografiskt lexikon

链接:https://sok.riksarkivet.se/sbl/Start.aspx

  • 瑞典人物传记辞典SBL,目前由瑞典国家档案库提供检索服务
  • 全文免费,词条数量不到一万
7. List of biographical dictionaries

链接:https://en.wikipedia.org/wiki/List_of_biographical_dictionaries

  • 维基百科页面,按国家列出已出版和正在编纂的传记辞典
  • 不完整,一些国家可能没有出版过类似辞典,且不是所有辞典都提供在线查询
  • 对于较早出版、已过版权期的辞典,可以尝试在对应的国家数字图书馆中搜索其扫描版(如法国的Nouvelle Biographie Générale即在Gallica中有全文)
8. RILM Music Encyclopedias

链接:https://rme.rilm.org/

  • RILM人工维护的在线音乐辞典汇总,包含1775年至今的60本音乐辞典,提供全文搜索
  • 搜索和段落预览免费,但全文阅读需要机构订阅(不支持个人)
  • 补充参考使用,类似的专业音乐辞典还有MGG2和New Grove,均需机构订阅,但前者可免费预览(https://www.mgg-online.com/

五、家谱学类

阿托7:家谱学材料是最有可能获得前所未见信息的途径,但或许同样也最需要耐心

阿托7:作为一个线上服务发展相当完善的学科,家谱学的所用资源也可以为生平研究提供不少帮助,并不局限于获知生卒年月、亲属关系和婚姻记录等,具体用途基本完全依靠想象力,有时看似完全不相干的材料里可能有意想不到的收获

阿托7:现在的家谱学网站繁多,但几乎全部需要订阅(因此没有列出MyHeritage、Ancestry等著名网站),且其中绝大多数均以美国为主,欧洲相对较少

1. FamilySearch

链接:https://www.familysearch.org/

  • 最大的免费家谱学网站,提供已录入数据库的记录搜索,并有大量图书档案源材料可供阅览(建议免费注册)
  • 自带一个维基网站(https://www.familysearch.org/en/wiki/Main_Page),详细讨论了各地各类型记录和档案的用途、历史和内容等相关情况,非常有助于家谱学资料的查找,也能为研究提供社会和文化背景资料
  • 馆藏家谱学相关材料种类极其丰富,数量巨大,但相当一部分材料不能在线查看,归档也相对不太完善,可能难以找到所需的目标文件
  • 即便明确知道所需何份文件,该档案也可能并不存在(如当时并未开始此类记录),或未能保存至今,或没有拍摄上线,因此无法阅览
2. Cyndi’s List

链接:https://www.cyndislist.com/

  • 由Cyndi Ingle个人创建、手动维护,是最大的家谱学网络资源门户网站,目前共收录三十余万条链接,覆盖几乎所有家谱学相关网站
  • 按主题分类检索,也可通过关键词搜索
  • 由于互联网上绝大多数家谱学网站均收费,因此门户指向的多数链接也都需要订阅,但该门户本身免费
3. GenWiki

链接:http://wiki-de.genealogy.net/

待续……

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注