«« Back to Top


漢字(形・音・義)検索

DB名称 種別 対象・内容 概要・使用法
漢字字体規範史データベース 字形 古文献
(含 敦煌文献)
 現在停止中。データは「CHISE IDS」に継承されている。
漢字字体規範史データセット 字形 古文献
(含 敦煌文献)
 「漢字字体規範史データベース」の前身「石塚漢字字体資料」の情報カードを電子化し、文字から検索出来る様にしたもの。
教育部《異體字字典》 字形
字義
 台湾教育部(日本の文科省に相当)による、異体字検索システム。異体字の画数で検索出来るため、元の字が皆目見当の付かないときに有効である。
異體字詞典 字形
字義
 厦門大学による異体字検索。用例が充実している。
拓本文字データベース 字形 石刻  京大人文研所蔵の拓本(前漢~民国)の文字(単漢字/フレーズ)検索システム。検索結果を拓本文字の画像で表示するため、複数の拓本の書体を通覧することが出来る。
史的文字データベース連携検索システム
(奈文研)
歷史文字資料庫統合檢索系統
(中研院)
字形 紀元前後
~19世紀
 木簡庫(奈文研),電子くずし字字典(東大史料編纂所),日本古典籍くずし字データセット(国文学研究資料館),漢字字体規範史データセット(京大人文研・国立国語研究所),簡牘字典(中央研究院歴史語言研究所)の横断検索。2020年10月現在、総計150万件の字形画像データが対象となっている。IIIF対応。
 奈文研と中研院(台湾)とでそれぞれ公開されているが、特に「木簡庫」「HNG」で検索結果(ヒット数)に若干の違いが見られる(2020年10月現在)。
電子くずし字字典データベース
木簡画像データベース・木簡字典
連携検索
字形 古文書・古記録
木簡
 電子くずし字字典データベースは東大史料編纂所の古文書・古記録の単漢字/フレーズ検索。検索結果一覧が画像表示されるため、字形を通覧出来る。「詳細検索」では年代・史料名・史料属性・『大漢和』番号などを指定しての検索が可能。
 木簡庫(旧・木簡字典(木簡画像データベース))は奈文研の木簡データベース(奈文研所蔵史料+他機関の史料)を単漢字/フレーズで検索出来る様にしたもの。内容・年代・出土地・素材・形状などを指定しての検索が可能。
MOJIZO
(木簡・くずし字解読システム)
字形 古文書・古記録
木簡
 文字画像をアップロードして、奈良文化財研究所の木簡、および東京大学史料編纂所の古文書・古記録から、類似する文字画像を検索する画像引き文字検索システム。アプリ版(MOJIZOkin)もある。
くずし字検索
くずし字認識ビューア
人文学オープンデータ共同利用センター
字形 日本古典籍
データセット

国文学研究資料館所蔵古典籍ほか
 日本古典籍くずし字データセットは、日本古典籍データセットの画像データから抽出し、人間/機械学習のために提供するくずし字データ。一文字検索も可能。
 くずし字認識ビューアは、IIIF準拠の画像データから文字判読をおこなうシステム。史料提供元の「マニフェスト」のURLをビューア画面にドラッグ&ドロップし、史料を読込む。画像表示部右上の「■」アイコン(マウスを動かしたときのみ出現)をクリックし、判読対象の1文字を囲む。選択範囲上での左クリックから「くずし字一文字認識」で、認識結果が表示される。
簡牘字典
字形 居延漢簡  居延漢簡の総合検索。木簡の画像に釈文データが組み込まれているため、単漢字のみならずフレーズ検索も可能。また、木簡の情報(資料番号,サイズ,年代,収録史料集など)も有している。
AI手書きくずし字検索 字形  枠内に手書き入力された崩し字(1字)を判別するシステム。個人の運営による。
字鑑 字形  漢字の画像(1字)を判別するシステム。
篆字部首検索システム
国文学研究資料館
字形 篆書  部首から篆書体を検索出来るシステム。主な部首の一覧表(PDF)も有用。
篆書字体データセット
人文学オープンデータ共同利用センター
字形 篆書  
小篆識別器
国学大師
字形 篆書  国学大師内のコンテンツ。専用のフォントファイルをPCにインストールしてから使用する。篆書体の文字が何の字か分からないときに、その字の構成部品を右側のフィールドから選択し、調べることができる。IE系しか動かない?
書法字典 字形 書・印章  行書・楷書・草書・隷書・篆書など各体の文字を、中国の墨蹟から一覧表示する(フレーズ検索不可)。また篆刻の検索では、官印などを字(フレーズ)で検索出来る。
漢典書法 字形 書・印章  篆書・隷書・楷書・行書・草書など各体の文字を、中国の墨蹟から一覧表示する(フレーズ検索不可)。
漢字古今字資料庫 字形 甲骨文・金文
など
 甲骨文・金文・戦国時代の文字・小篆を横断検索出来る。主要辞書におけるページ数なども記載。
書同文漢字網 字形  Web上での文字の手書き入力、簡繁(台・香)日韓の字形差一覧表、草書検索などを利用出来る。
グリフウィキ 字形 漢字電算処理
外字作成
 誰でも編集可能な明朝体の漢字字形データベース。Unicodeにない漢字を外字として簡単に作成し、自分のPC上で使用することが出来る。また、関連する字がリンクされており、異体字などを検索する際に便利。
フォント販売サイト
【例】 Font Factory / Font Garate
字形 フォント  ウラ技。篆書体や草書体・行書体をシミュレートすることが出来るフォント販売サイトがある。実例ではなく、あくまでデザインされた「フォント」であるが、一定数の任意の文字列を試すことが出来るので(例えば「光緒二年季夏瑠璃廠」)、一文字ずつ検索するよりも便利なときがある(フォントをお買い上げすれば自分のPC上でWordとかで試せますけどね。ただ同じ「篆書体」と言っても、種類によって結構字形が異なるので、何パターンかを串刺しで試せるこちらの法がたぶん安価で便利)。
漢字データベースプロジェクト 字形 漢字電算処理  「大漢和辞典⇔UCS対応表」「大漢和辞典・熟語データ」など、漢字の電算処理に関する様々な情報・諸データを公開する。
電書時代の文字コードを考える
(ための資料)
(wakufactory)
字形 漢字電算処理  「UTF文字コード表」「文字コードチェッカー」「IVS異体字メーカー」「Unicodeデコーダ」など各種資料・ツールを公開する。
CHISE IDS 漢字検索 字形 PC上での
漢字検索
 文字に関する様々な知識を集約し、コンピュータ上で漢字などを手軽に使える環境の整備を目指すプロジェクト。IMEの変換や手書き入力では出しにくい文字を、文字構成部品を入力して検索することが出来る。「氵(さんずい)」は「水」、「イ(にんべん)」は「人」を入力する。「&M-*****;」(末尾にセミコロン)で『大漢和』の文字番号を検索。
 検索結果の、文字に続く英数字はUnicode番号など各種文字コード番号、続く点線の四角と部品は、構成要素とその配置。CJK拡張漢字を表現するためには、それらのグリフを実装したフォントファイル(「花園フォント」など)が必要。
異体字セレクタセレクタ 字形 文字情報
(IVS)
 IVSの状況を調べるシステム。中央部の検索窓に入力・検索すると、使用可能な字形が表示される。左の「コピー」をクリックすると、異体字セレクタ(字形選択子)を伴ってクリップボードにコピーされるので、対応したアプリケーションで使用することが出来る。また、左上の入力部分に文字をペーストすると、その文字列に含まれるコードが直下の黄色い領域に **** E01** で表示される。
文字情報基盤検索システム 字形 漢字電算処理  戸籍統一文字番号・住基ネット統一文字コードなど、各種漢字字典の文字番号などを表示する。また、構成部品や各種コード・番号から漢字を検索出来る。
古今文字集成 字形
字音
字義
漢字
西夏文字
契丹文字
女真文字
パスパ文字
 文字についての諸情報(字音・字義・異体字・Unicodeなど)を表示する。
漢語多功能字庫 字形
字音
字義
漢字  文字についての諸情報(字音・字義・異体字・Unicodeなど)を表示する。
字海 字形
字音
字義
漢字  
漢字古今音資料庫
小学堂
字音 復元音
現代の方言
 上古音・中古音・近代音(未実装)・現代音・域外訳音(未実装)を、カールグレン(高本漢)や王力の研究成果も含め横断検索出来る。「字」に検索したい文字を入力し、上の各時代別項目から調べたい音韻を指定して、「確定送出」をクリックする。「現代音」は各地域の方言のほか、北京を始めとする各官話なども含む。
 小学堂のトップページでは、復元音のほか、字義や、各種字書のページ数などを一気に検索することが出来る。
復旦大学 中華文明数据中心 字音
字義
復元音
字書・韻書
方言
 上古音・中古音(カールグレン(高本漢),王力など)の横断検索などが可能。
韻典網 字音 『広韻』
『中原音韻』
など
 『広韻』『中原音韻』などの音韻を検索出来る。
漢越辞典摘引
(Hán Việt Từ Điển)
字音 クォックグー  クォックグー及び用例検索ツール。
喃産遺存保會
(Another Nôm Lookup Tool based on Unicode)
字形
字音
クォックグー・チュノム・漢字  クォックグー・チュノム・漢字・Unicode(16進数)・英単語・広東語・北京語を相互検索するツール。
Web支那漢
(『支那文を読む為の漢字典』)
字義 『支那文を読む為の漢字典』  田中慶太郎(編訳)『支那文を読む為の漢字典』(山本書店,1940.通称『支那漢』)の電子版。陸爾・奎方毅(編)『学生字典』(上海商務印書館,1915) を翻訳し、『辞源』『中華大字典』を用いて増補したもの。訓読みは「漢字にあてた日本語で、字義とは必ずしも一致しない」ために誤解を生ずるとして、訓を付けずに字義を直接説明する(「漢字引きの国語辞典」からの脱却、漢字漢語・日本語の対訳辞書)。熟語は載せない。親字は約8,000 字。中国語発音はウェード式で表記。中国語の古典語読み・北京官話などを含む場合がある。
康熙字典網上版 形音義 『康煕字典』  『康煕字典』収録字を検索・版面の画像参照が可能。
『ヒエラティック古書体学』
データベース
ヒエラティック  昔々、アタナシウス・キルヒャーという、漢字はヒエログリフを祖とする文字だと言った人がいましてね……(何
 

フォントファイル

DB名称 書体 概要・使用法
花園フォント 明朝体  インストールすれば、漢字(明朝体)に関してはUnicodeに含まれる全ての漢字、その他突厥ルーンなどをPCで表現出来る様になる。
独立行政法人情報処理推進機構
(IPA)
明朝体  主に行政で用いられる人名漢字等(戸籍で使用される全ての文字・約6万7,000字)を電子的に扱うためのIVS規格・「Hanyo-Denshi」を整備する。文字情報データベースおよび再現するための「IPAmj明朝フォント」などを公開する。
源ノ角ゴシック
(Source Han Sans / 思源黑体 / 본고딕)

源ノ明朝
(Source Han Serif / 思源宋体 / 본명조)

ゴシック体
明朝体
 Unicode上では区別されない(漢字統合)日本・中国(繁体/簡体)・韓国の細かい字形の差を、統一されたデザインで、別々のグリフとして収録する。ウェイト(太さ)は7種類。詳細はこちらを参照。フォントのダウンロードはGitHub内の「Subset OTFs」から。 源ノ明朝
Google Fonts 900種類以上  多彩な書体のWebフォントを提供する。
白川フォント 甲骨・金文
・篆文など
 「白川静記念 東洋文字文化研究所 古代文字フォント」
今昔文字鏡 明朝体  漢字(『大漢和』の全収録字、国字、甲骨文字、簡体字など)・梵字・西夏文字・字喃などのグリフを、日本語Shift_JISのコードポイントに配置したフォント。ようは、本来あるべき字のところに、別の字を配置・表示させているため、電子的な「文字の伝達」するものとしては意味を為さない。このフォントを使用したドキュメントファイルを他のコンピュータで開いた場合、文字鏡フォントが入っていない限り必ず文字化けする。UnicodeのCJK領域がが拡張され続けている現在、漢字に関しては、まずはUnicodeに収録されていないかを探すべきである(製品版は、文字検索ツールとしては優秀である)。なお、文字鏡研究会は解散し、文字鏡フォント(最終版)および「Mojikyo Character MAP」が公開されている。
GT書体フォント 明朝体  その昔、国産OS(TRON: The Real-time Operating system Nucleus)プロジェクトとゆーのがあって、そこではあらゆる漢字(「史」のヒゲのあるやつとないやつを別字として集録したり、甲骨文字とか梵字とかも含む)も集録していて、それをTRONコードと言ったのじゃ……。結局、国産OSはアメリカとの貿易摩擦問題で立ち消えて、「超漢字」(OS)や「今昔文字鏡」に繋がっていったのじゃ……。ちなみに「『漢語大詞典』部首索引」は、元々GTフォントで作ったのじゃ……(フリーでフォントが手に入ったから)。
 

便利ツール

ツール名 種別 概要・使用法
Pinconv 4  漢字→ピンイン、日・簡・繁体の相互変換ツール。辞書機能により、头发←→頭髮、发布←→發布などの区別が可能。
 
 
© ROOM #1317