■仕様説明
DataSpider Servista 内部ではデータを Unicode として扱っています。
そのため、Unicode の文字コードセットに含まれる文字が、
連携先の文字セットに含まれない文字の場合は、文字化けが発生します。
<例>
機種依存文字「(株)」が含まれている UTF-8 の CSV ファイルを読み取り、
エンコードに Windows-31J を指定して CSV ファイルを出力した場合は文字化けは発生しません。
Shift_JIS で出力した場合は文字化けが発生します。
上記より、機種依存文字の「(株)」や「(有)」の文字化けを回避したい場合は、
適切なエンコードを指定してください。
何らかの事情で適切なエンコードが指定できない場合、
Mapper ロジックの [正規表現置換] ロジックにて、
置換前文字列に Unicode のコードポイント(\uXXXX)、
置換後文字列に出力したい文字列を設定することで、
想定通りの結果となるかご確認ください。
例)機種依存文字「㈱」で文字化けしている場合は以下の様に設定します。
1.「置換前文字列(正規表現パターン)」に、機種依存文字「(株)」の Unicode の文字コード「\u878A」を設定
2.「置換後文字列」に、機種依存文字ではない「(株)」を設定
なお、各機種依存文字のコードポイントがどのような値であるかにつきましては、
お手数ですがお客様自身でご確認をお願いいたします。
参考情報といたしまして、「サクラエディタ」によるコードポイントの確認方法をご紹介します。
■サクラエディタによるコードポイントの確認方法
テキストエディタの「サクラエディタ」を使用したコードポイントの確認方法について下記に手順を記載いたします。
なお、「サクラエディタ」につきましては、弊社から提供している製品ではないため、
機能の詳細などにつきましては、「サクラエディタ」の開発元へご確認をお願いいたします。
---
1. 対象の文字列を含むファイルを開きます。
2. サクラエディタの文字コード設定を [Unicode] に変更。
3. 対象の文字までカーソルを移動させます。
4. ウィンドウ下部のステータスバーに、16 進数による文字コードが表示されます。
---