医学用語変換辞書を作成

2021/02/06
医学薬学に携わり年月が経過しました。そしてPCとのお付き合いはそれ以上の年月。その間、PCの日本語変換辞書には数多くの医学薬学系単語が蓄積されました。
このたび、久しぶりにWindowsマシンを買うに当たり、MacintoshのATOKからMicrosoft IMEへ辞書の変換を迫られ、変換辞書の整理をしました。
せっかく整理しましたので、医学辞書として公開することにしました。

VJEから始まり今に至る

日本語変換ソフトといえるものに出会ったのは、東京で開催されていたビジネスショー。

今もあるかどうかは不明ですが、バックスという会社が「VJE」という日本語変換ソフトを出展していました。

当時の日本語変換は単漢字変換が当たり前の中、「もももすももももものうち」と入力すると一発で「桃もスモモも桃のうち」と返してくるのを目の当たりにして、衝撃というか喜びに近い感覚の走ったことを鮮明に記憶しております。

当然、すぐさまVJEを購入して意味のない文字変換に何日も興じたことを覚えています。

その後、どのような変遷をたどり、現在のMac ATOKで作文作業をしているかはあまり覚えておりませんが、高度な日本語変換はすでに当たり前の存在になっています。

でも、この分野で革新的な進歩をVJE以降に感じたことはありません。その証拠に未だにATOK2013というレガシーなものを使用しています。

このたび、モバイルWindowsマシンが必要となり、やむなく購入。そのマシンのMicrosoft IMEにMacintoshで培われたATOK辞書を移す必要が生じました。

そこで、ATOKよりユーザー辞書を切り出し、長年堆積したジャンクデータを削除して、Microsoft IMEとGoogle日本語入力用に加工。

さらに、折角なので公開して皆様の評価を頂戴しようと考えました。

公開データ

ATOK用とMicrosoft IME用を公開します。ともにテキストファイルで、[読み]、[単語]、[品詞]の構成になっており、タブでセパレートされています。

ATOK用はUTF-8 + LF、Microsoft IMEはShift-JIS + CRLFフォーマットにしてあります。

Microsoft IMEは品詞を全て[名詞]にしてあります。登録できる品詞が少ないため、ATOKに比べ見出し語が少なくなっています。

一括導入してしまうと削除するのは大変面倒です。導入前にテキストエディタやExcelなどで不要箇所の削除を行った後に導入して下さい。

ATOKやMicrosoft IMEへの導入のしかたについては正規の案内などをご参照下さい。

なお、前述のように内容は私が長年仕事で貯めたデータですので、登録の間違いや領域の偏りはきっとあると思います。

ご使用になって生じた問題に私は責任を負いません。自己責任での使用をお願いします。

ご意見ご要望がありましたら、メッセージを残して下さい。

タイトル ファイル名 作成日時 サイズ 説明
ATOK用医学辞書ファイル ATOK.txt 2021/02/06 1,205.07 KB 約2万9千語の医学関連の見出し語があります。UTF-8 + LFフォーマット。
Google日本語入力 google.txt 2021/09/09 1,175.57 KB Atok用を読み込ませて、UTF-8 LFで出力しました。 Google日本語入力はAtok用を使ったほうが良いかも。
Microsoft IME用医学辞書ファイル Microsoft_IME.txt 2021/02/06 744.38 KB 約2万5千語の医学関連の見出し語があります。Sift-JIS + CRLFフォーマット。

Microsoft IME版使用感想

名詞だけの登録のMicrosoft IME版ですが、全く支障なく使えますね。

サ変化名詞やらなにやらこだわって登録していましたが、普通の使用にはなんら影響のないことを自分で確かめてしまいました。


コメント欄を読み込み中