• 文字サイズ変更
  • S
  • M
  • L

FAQのNo.から検索


  • No : 35747
  • 公開日時 : 2024/04/30 08:22
  • 更新日時 : 2024/04/30 08:26
  • 印刷
DSServista

【DataSpider Servista】機種依存文字の文字化けを回避したい

文字列中にある機種依存文字「(株)」が文字化けして出力されてしまいます。
回避方法を教えてください。
カテゴリー : 

回答

■仕様説明
DataSpider Servista 内部ではデータを Unicode として扱っています。

そのため、Unicode の文字コードセットに含まれる文字が、
連携先の文字セットに含まれない文字の場合は、文字化けが発生します。

<例>
機種依存文字「(株)」が含まれている UTF-8 の CSV ファイルを読み取り、
エンコードに Windows-31J を指定して CSV ファイルを出力した場合は文字化けは発生しません。
Shift_JIS で出力した場合は文字化けが発生します。

上記より、機種依存文字の「(株)」や「(有)」の文字化けを回避したい場合は、
適切なエンコードを指定してください。
 
何らかの事情で適切なエンコードが指定できない場合、
Mapper ロジックの [正規表現置換] ロジックにて、
置換前文字列に Unicode のコードポイント(\uXXXX)、
置換後文字列に出力したい文字列を設定することで、
想定通りの結果となるかご確認ください。

例)機種依存文字「㈱」で文字化けしている場合は以下の様に設定します。

 1.「置換前文字列(正規表現パターン)」に、機種依存文字「(株)」の Unicode の文字コード「\u878A」を設定
 2.「置換後文字列」に、機種依存文字ではない「(株)」を設定

なお、各機種依存文字のコードポイントがどのような値であるかにつきましては、
お手数ですがお客様自身でご確認をお願いいたします。

参考情報といたしまして、「サクラエディタ」によるコードポイントの確認方法をご紹介します。

■サクラエディタによるコードポイントの確認方法
テキストエディタの「サクラエディタ」を使用したコードポイントの確認方法について下記に手順を記載いたします。
なお、「サクラエディタ」につきましては、弊社から提供している製品ではないため、
機能の詳細などにつきましては、「サクラエディタ」の開発元へご確認をお願いいたします。
---
1. 対象の文字列を含むファイルを開きます。
2. サクラエディタの文字コード設定を [Unicode] に変更。
3. 対象の文字までカーソルを移動させます。
4. ウィンドウ下部のステータスバーに、16 進数による文字コードが表示されます。
---

 
目的別で検索
設定

このFAQに関してのご意見をお聞かせ下さい。