MS Word文書からの移植

SWP/SWはMS Word文書(.doc/.docx)には対応していません。

数式を含むWord文書をSWP/SWに移植したい場合は、「Word文書 (.doc/.docx) 」形式のファイルをOfficeで開いて名前を付けて保存で「リッチテキスト形式 (RTF) (.rtf)」で保存し直し、それをSWP/SWで開く(もしくはインポート)することでTeX文書として編集保存することができます。

ただし、弊社で検証した結果、完全な変換には程遠く、手作業でSWP/SWでほぼ文書を作り直すに等しい編集をしなければならないことが判明しております。

主な問題点は以下の通りです。

  1. 日本語のRTF文書はSWP/SWで開くと文字化けします。
  2. SWP/SWが想定しているRTFファイルがMS Office2003以前のOfficeで作成されたものであり、Office2007からRTF形式の内部仕様が変更されたため、Office2007以降のOfficeで作成されたRTFファイルを開くと、余分な文字列が挿入されたり、以前よりも更にレイアウトが崩れてしまったりします。
  3. 文書のタイトルや著者などは自動的にTeXのタイトルや著者等には変換されません。
  4. パートやセクションなどの見出しの様式は自動的には適用されません。
  5. 変換可能な数式は、Officeの数式3.0、もしくはMathType3かMathType5で書かれもののみです。Office2007から導入された数式エディタで書かれたものは変換できません。
  6. 画像の大きさが正しく指定されません。
  7. 図や表は高確率で表示やレイアウトが崩れます。
  8. 参考文献がTeXの様式にはなりません。
  9. 図表/参考文献への参照が設定されません。

よって以下のような作業が必要となります。

  1. 日本語は別途コピーしてSWP(SW)に貼り付ける
  2. タイトルなどをフロントマターに移す
  3. 章題などに適切なタグをつける
  4. 数式を書き直す
  5. 画像を挿入し直す
  6. 図や表を書き直す
  7. 参考文献をTeXの様式で書き直す
  8. 図表/参考文献への参照を設定する
  9. TeXで表示できない文字をTeX用の文字で置き換える

 


以上のような状態でもSWP/SWでTeX文書化を行いた場合は、以下の手順をご覧ください。

具体例で手順を説明します。英文書であれば一括変換が可能ですが、日本語文書の場合には数式部とテキスト部を別個に扱う形となります。

 Note:SWP/SW5.5はMS Word2007以降のバージョンのWordの仕様変更に対応できていないため、 MS Word2007以降のバージョンのWordで作成された.rtf形式で保存したファイルは、そのままSWP/SW5.5で開く、または内容のインポートでインポートしようとするとエラーが発生する場合があります。
一度Windowsのアクセサリにある「ワードパッド」で.rtfのファイルを開き、もう一度.rtf形式で保存し直すと、SWP/SW5.5で開く、または内容のインポートでインポートが出来るようになる場合があります。
この操作を行っても文書の内容によってはうまくいかない場合があります。
予めご了承ください。

1. 英文書の場合

ここではMS Word2003と数式エディタを用いて作成された次の文書(リッチテキスト形式)ファイルを例にとって操作手順を説明します。

次にSWP/SW上で「ファイルを開く」という操作を行います。その際、「ファイルの種類」として「RTF」を選択し上記RTF文書を開きます。

※新規作成でシェルフォルダ:Standard LaTeX、シェルファイル:Blank - Standard LaTeX Articleを選択してブランクの英文書を開き、ファイルメニューから「内容のインポート」を選択し、ファイルの種類で「RTF(*.rtf)」を選択してインポートする方法もあります。

この例からもわかるように、数式エディタで作成された数式はすべて自動的にTeXに変換されます。これをそのままタイプセット(「英語タイプセット」)した結果が次のPDFファイルです。

Note:TeXに自動的に変換される数式はMicrosoft数式3.0、MathType3または5で作成された数式のみですのでご注意ください。Word 2007から新しく搭載された数式の入力/編集機能で作成された数式はTeXに自動的に変換できません。SWP/SWで読み込めるようにするためにワードパッドで保存し直した段階で画像に変換されるため、SWP/SWで開くまたはインポートすると数式の画像ファイルを生成して画像として読み込まれます。

なお、修正が全く不要というわけではありません。必要な編集はSWP/SW上で行ってください。この例で言うと次のような点に対し修正が必要となります。

  • セクションタイトルの書体(12pt, 太字)が反映されていない。
  • インライン数式の一部がディスプレイ数式となってしまっている。

いずれも大きな編集作業を伴うものではありません。

Note:MS Word2007以降のバージョンのWordで作成されたリッチテキスト形式のファイルをWindowsのワードパッドで保存し直したファイルの場合は、レイアウトが崩れたり不要な文字列が挿入されるなど、大きな修正が必要となる場合があります。

2. 日本語文書の場合

上記のRTFインポートの機能は日本語に対応していません。このため日本語のMS Word文書をSWP/SW環境に取り込むためには、数式部とテキスト部とで別個のアプローチを取る必要が生じます。次の文書を例にとって説明します。

数式部の扱い

複雑な数式については上記RTFインポート機能を使ってTeX化を行います。以下の操作で対応してください。

  • 日本語を含まない数式だけを抽出した文書をMS Word上で作成しRTF形式で保存します。
  • それをSWP/SWから開くと、数式エディタで作成した数式が自動的にTeXに変換されます。これを補助文書として使用します。

日本語文書の作成

SWP/SW上の新規作成ボタンを押し、jsarticle等の日本語文書用シェルを開きます。その上にテキスト部と数式部をコピー&ペーストして行きます。テキスト部はオリジナルのMS Word文書から、数式部は上で作成した補助文書から移植します。インライン数式等で再入力した方が早いものについては入力操作を行ってください。またセクションタグ等、必要なタグは適宜設定してください。以下は移植後の文書の一例です。

    mswordJ.pdf (12KB)

Note:  セクション番号や数式番号はTeXによって自動的に付加されます。抑止したり変更する操作はSWP/SW上で行ってください。
Note:  RTFインポートによって生成されるSWP/SW文書はドキュメントクラスがarticleとなっているため日本語は入力できません。
Note: Word2007以降のバージョンにてこの操作を行うと、仕様変更のためかうまくいかないことがあります。ご了承ください。