漢字(形・音・義)検索
DB名称 | 種別 | 対象・内容 | 概要・使用法 |
(含 敦煌文献) |
現在停止中。データは「CHISE IDS」に継承されている。 | ||
漢字字体規範史データセット | 字形 | 古文献 (含 敦煌文献) |
「漢字字体規範史データベース」の前身「石塚漢字字体資料」の情報カードを電子化し、文字から検索出来る様にしたもの。 |
教育部《異體字字典》 | 字形 字義 |
台湾教育部(日本の文科省に相当)による、異体字検索システム。異体字の画数で検索出来るため、元の字が皆目見当の付かないときに有効である。 | |
異體字詞典 | 字形 字義 |
厦門大学による異体字検索。用例が充実している。 | |
拓本文字データベース | 字形 | 石刻 | 京大人文研所蔵の拓本(前漢~民国)の文字(単漢字/フレーズ)検索システム。検索結果を拓本文字の画像で表示するため、複数の拓本の書体を通覧することが出来る。 |
史的文字データベース連携検索システム (奈文研) 歷史文字資料庫統合檢索系統 (中研院) |
字形 | 紀元前後 ~19世紀 |
木簡庫(奈文研),電子くずし字字典(東大史料編纂所),日本古典籍くずし字データセット(国文学研究資料館),漢字字体規範史データセット(京大人文研・国立国語研究所),簡牘字典(中央研究院歴史語言研究所)の横断検索。2020年10月現在、総計150万件の字形画像データが対象となっている。IIIF対応。 奈文研と中研院(台湾)とでそれぞれ公開されているが、特に「木簡庫」「HNG」で検索結果(ヒット数)に若干の違いが見られる(2020年10月現在)。 |
電子くずし字字典データベース 木簡画像データベース・木簡字典 連携検索 |
字形 | 古文書・古記録 木簡 |
電子くずし字字典データベースは東大史料編纂所の古文書・古記録の単漢字/フレーズ検索。検索結果一覧が画像表示されるため、字形を通覧出来る。「詳細検索」では年代・史料名・史料属性・『大漢和』番号などを指定しての検索が可能。 木簡庫(旧・木簡字典(木簡画像データベース))は奈文研の木簡データベース(奈文研所蔵史料+他機関の史料)を単漢字/フレーズで検索出来る様にしたもの。内容・年代・出土地・素材・形状などを指定しての検索が可能。 |
MOJIZO (木簡・くずし字解読システム) |
字形 | 古文書・古記録 木簡 |
文字画像をアップロードして、奈良文化財研究所の木簡、および東京大学史料編纂所の古文書・古記録から、類似する文字画像を検索する画像引き文字検索システム。アプリ版(MOJIZOkin)もある。 |
くずし字検索 くずし字認識ビューア (人文学オープンデータ共同利用センター) |
字形 | 日本古典籍 データセット ※国文学研究資料館所蔵古典籍ほか |
日本古典籍くずし字データセットは、日本古典籍データセットの画像データから抽出し、人間/機械学習のために提供するくずし字データ。一文字検索も可能。 くずし字認識ビューアは、IIIF準拠の画像データから文字判読をおこなうシステム。史料提供元の「マニフェスト」のURLをビューア画面にドラッグ&ドロップし、史料を読込む。画像表示部右上の「■」アイコン(マウスを動かしたときのみ出現)をクリックし、判読対象の1文字を囲む。選択範囲上での左クリックから「くずし字一文字認識」で、認識結果が表示される。 |
簡牘字典 |
字形 | 居延漢簡 | 居延漢簡の総合検索。木簡の画像に釈文データが組み込まれているため、単漢字のみならずフレーズ検索も可能。また、木簡の情報(資料番号,サイズ,年代,収録史料集など)も有している。 |
AI手書きくずし字検索 | 字形 | 枠内に手書き入力された崩し字(1字)を判別するシステム。個人の運営による。 | |
字鑑 | 字形 | 漢字の画像(1字)を判別するシステム。 | |
篆字部首検索システム (国文学研究資料館) |
字形 | 篆書 | 部首から篆書体を検索出来るシステム。主な部首の一覧表(PDF)も有用。 |
篆書字体データセット (人文学オープンデータ共同利用センター) |
字形 | 篆書 | |
小篆識別器 (国学大師) |
字形 | 篆書 | 国学大師内のコンテンツ。専用のフォントファイルをPCにインストールしてから使用する。篆書体の文字が何の字か分からないときに、その字の構成部品を右側のフィールドから選択し、調べることができる。IE系しか動かない? |
書法字典 | 字形 | 書・印章 | 行書・楷書・草書・隷書・篆書など各体の文字を、中国の墨蹟から一覧表示する(フレーズ検索不可)。また篆刻の検索では、官印などを字(フレーズ)で検索出来る。 |
漢典書法 | 字形 | 書・印章 | 篆書・隷書・楷書・行書・草書など各体の文字を、中国の墨蹟から一覧表示する(フレーズ検索不可)。 |
漢字古今字資料庫 | 字形 | 甲骨文・金文 など |
甲骨文・金文・戦国時代の文字・小篆を横断検索出来る。主要辞書におけるページ数なども記載。 |
書同文漢字網 | 字形 | Web上での文字の手書き入力、簡繁(台・香)日韓の字形差一覧表、草書検索などを利用出来る。 | |
グリフウィキ | 字形 | 漢字電算処理 外字作成 |
誰でも編集可能な明朝体の漢字字形データベース。Unicodeにない漢字を外字として簡単に作成し、自分のPC上で使用することが出来る。また、関連する字がリンクされており、異体字などを検索する際に便利。 |
フォント販売サイト 【例】 Font Factory / Font Garate |
字形 | フォント | ウラ技。篆書体や草書体・行書体をシミュレートすることが出来るフォント販売サイトがある。実例ではなく、あくまでデザインされた「フォント」であるが、一定数の任意の文字列を試すことが出来るので(例えば「光緒二年季夏瑠璃廠」)、一文字ずつ検索するよりも便利なときがある(フォントをお買い上げすれば自分のPC上でWordとかで試せますけどね。ただ同じ「篆書体」と言っても、種類によって結構字形が異なるので、何パターンかを串刺しで試せるこちらの法がたぶん安価で便利)。 |
漢字データベースプロジェクト | 字形 | 漢字電算処理 | 「大漢和辞典⇔UCS対応表」「大漢和辞典・熟語データ」など、漢字の電算処理に関する様々な情報・諸データを公開する。 |
電書時代の文字コードを考える (ための資料) (wakufactory) |
字形 | 漢字電算処理 | 「UTF文字コード表」「文字コードチェッカー」「IVS異体字メーカー」「Unicodeデコーダ」など各種資料・ツールを公開する。 |
CHISE IDS 漢字検索 | 字形 | PC上での 漢字検索 |
文字に関する様々な知識を集約し、コンピュータ上で漢字などを手軽に使える環境の整備を目指すプロジェクト。IMEの変換や手書き入力では出しにくい文字を、文字構成部品を入力して検索することが出来る。「氵(さんずい)」は「水」、「イ(にんべん)」は「人」を入力する。「&M-*****;」(末尾にセミコロン)で『大漢和』の文字番号を検索。 検索結果の、文字に続く英数字はUnicode番号など各種文字コード番号、続く点線の四角と部品は、構成要素とその配置。CJK拡張漢字を表現するためには、それらのグリフを実装したフォントファイル(「花園フォント」など)が必要。 |
異体字セレクタセレクタ | 字形 | 文字情報 (IVS) |
IVSの状況を調べるシステム。中央部の検索窓に入力・検索すると、使用可能な字形が表示される。左の「コピー」をクリックすると、異体字セレクタ(字形選択子)を伴ってクリップボードにコピーされるので、対応したアプリケーションで使用することが出来る。また、左上の入力部分に文字をペーストすると、その文字列に含まれるコードが直下の黄色い領域に **** + E01** で表示される。 |
文字情報基盤検索システム | 字形 | 漢字電算処理 | 戸籍統一文字番号・住基ネット統一文字コードなど、各種漢字字典の文字番号などを表示する。また、構成部品や各種コード・番号から漢字を検索出来る。 |
古今文字集成 | 字形 字音 字義 |
漢字 西夏文字 契丹文字 女真文字 パスパ文字 |
文字についての諸情報(字音・字義・異体字・Unicodeなど)を表示する。 |
漢語多功能字庫 | 字形 字音 字義 |
漢字 | 文字についての諸情報(字音・字義・異体字・Unicodeなど)を表示する。 |
字海 | 字形 字音 字義 |
漢字 | |
漢字古今音資料庫 (小学堂) |
字音 | 復元音 現代の方言 |
上古音・中古音・近代音(未実装)・現代音・域外訳音(未実装)を、カールグレン(高本漢)や王力の研究成果も含め横断検索出来る。「字」に検索したい文字を入力し、上の各時代別項目から調べたい音韻を指定して、「確定送出」をクリックする。「現代音」は各地域の方言のほか、北京を始めとする各官話なども含む。 小学堂のトップページでは、復元音のほか、字義や、各種字書のページ数などを一気に検索することが出来る。 |
復旦大学 中華文明数据中心 | 字音 字義 |
復元音 字書・韻書 方言 |
上古音・中古音(カールグレン(高本漢),王力など)の横断検索などが可能。 |
韻典網 | 字音 | 『広韻』 『中原音韻』 など |
『広韻』『中原音韻』などの音韻を検索出来る。 |
漢越辞典摘引 (Hán Việt Từ Điển) |
字音 | クォックグー | クォックグー及び用例検索ツール。 |
喃産遺存保會 (Another Nôm Lookup Tool based on Unicode) |
字形 字音 |
クォックグー・チュノム・漢字 | クォックグー・チュノム・漢字・Unicode(16進数)・英単語・広東語・北京語を相互検索するツール。 |
Web支那漢 (『支那文を読む為の漢字典』) |
字義 | 『支那文を読む為の漢字典』 | 田中慶太郎(編訳)『支那文を読む為の漢字典』(山本書店,1940.通称『支那漢』)の電子版。陸爾・奎方毅(編)『学生字典』(上海商務印書館,1915) を翻訳し、『辞源』『中華大字典』を用いて増補したもの。訓読みは「漢字にあてた日本語で、字義とは必ずしも一致しない」ために誤解を生ずるとして、訓を付けずに字義を直接説明する(「漢字引きの国語辞典」からの脱却、漢字漢語・日本語の対訳辞書)。熟語は載せない。親字は約8,000 字。中国語発音はウェード式で表記。中国語の古典語読み・北京官話などを含む場合がある。 |
康熙字典網上版 | 形音義 | 『康煕字典』 | 『康煕字典』収録字を検索・版面の画像参照が可能。 |
『ヒエラティック古書体学』 データベース |
ヒエラティック | 昔々、アタナシウス・キルヒャーという、漢字はヒエログリフを祖とする文字だと言った人がいましてね……(何 | |
フォントファイル
DB名称 | 書体 | 概要・使用法 |
花園フォント | 明朝体 | インストールすれば、漢字(明朝体)に関してはUnicodeに含まれる全ての漢字、その他突厥ルーンなどをPCで表現出来る様になる。 |
独立行政法人情報処理推進機構 (IPA) |
明朝体 | 主に行政で用いられる人名漢字等(戸籍で使用される全ての文字・約6万7,000字)を電子的に扱うためのIVS規格・「Hanyo-Denshi」を整備する。文字情報データベースおよび再現するための「IPAmj明朝フォント」などを公開する。 |
源ノ角ゴシック (Source Han Sans / 思源黑体 / 본고딕) 源ノ明朝 (Source Han Serif / 思源宋体 / 본명조) |
ゴシック体 明朝体 |
Unicode上では区別されない(漢字統合)日本・中国(繁体/簡体)・韓国の細かい字形の差を、統一されたデザインで、別々のグリフとして収録する。ウェイト(太さ)は7種類。詳細はこちらを参照。フォントのダウンロードはGitHub内の「Subset OTFs」から。 |
Google Fonts | 900種類以上 | 多彩な書体のWebフォントを提供する。 |
白川フォント | 甲骨・金文 ・篆文など |
「白川静記念 東洋文字文化研究所 古代文字フォント」 |
今昔文字鏡 | 明朝体 | 漢字(『大漢和』の全収録字、国字、甲骨文字、簡体字など)・梵字・西夏文字・字喃などのグリフを、日本語Shift_JISのコードポイントに配置したフォント。ようは、本来あるべき字のところに、別の字を配置・表示させているため、電子的な「文字の伝達」するものとしては意味を為さない。このフォントを使用したドキュメントファイルを他のコンピュータで開いた場合、文字鏡フォントが入っていない限り必ず文字化けする。UnicodeのCJK領域がが拡張され続けている現在、漢字に関しては、まずはUnicodeに収録されていないかを探すべきである(製品版は、文字検索ツールとしては優秀である)。なお、文字鏡研究会は解散し、文字鏡フォント(最終版)および「Mojikyo Character MAP」が公開されている。 |
GT書体フォント | 明朝体 | その昔、国産OS(TRON: The Real-time Operating system Nucleus)プロジェクトとゆーのがあって、そこではあらゆる漢字(「史」のヒゲのあるやつとないやつを別字として集録したり、甲骨文字とか梵字とかも含む)も集録していて、それをTRONコードと言ったのじゃ……。結局、国産OSはアメリカとの貿易摩擦問題で立ち消えて、「超漢字」(OS)や「今昔文字鏡」に繋がっていったのじゃ……。ちなみに「『漢語大詞典』部首索引」は、元々GTフォントで作ったのじゃ……(フリーでフォントが手に入ったから)。 |
便利ツール
ツール名 | 種別 | 概要・使用法 |
Pinconv 4 | 漢字→ピンイン、日・簡・繁体の相互変換ツール。辞書機能により、头发←→頭髮、发布←→發布などの区別が可能。 | |