OpenText Captivaとは? わかりやすく解説

Captiva (ソフトウェア)

(OpenText Captiva から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/12/19 03:56 UTC 版)

ナビゲーションに移動 検索に移動

Captivaは、主として紙から、画像を介してデータを取得するキャプチャーソフトウェアである。現在はOpenTextのキャプチャー製品の一つとして提供され、OpenText Captivaと称されている。

歴史

[1] Pixel Translationsからのイメージ処理、キャプチャープロセス全体のInputAccel、SWTからの機械学習を含む分類・認識技術に源流がある。

  • 1991年 Pixel Translationsが、ISISスキャンドライバーを開発
  • 1994年 Cornerstone Imagingが、Pixel Translationsを買収
  • 1995年 Cornerstone Imagingが、InputAccelを開発
  • 1997年 TextWareとSymbusが統合し、FormWareとなる
  • 1998年 Cornerstone Imagingのソフトウェア部門がスピンオフし、Input Softwareとなる
  • 1998年 FormWareとWheb SystemsGlobalが統合し、Captivaとなる
  • 2000年 Input SoftwareがActionPointとなる
  • 2002年 ActionPointが、Captivaを買収し、社名をCaptivaとする
  • 2005年 Captivaが、SWTを買収
  • 2005年 EMCがCaptivaを買収
  • 2016年 DellがEMCを買収し、Dell EMCとなる
  • 2017年 OpenTextが、Dell EMCのEnterprise Content Division (ECD)を買収

最新[2] のバージョンは2018年1月にリリースされた7.7である。

機能

[3]

キャプチャー

ISISドライバーを使用したスキャナーを直接制御して紙からのスキャンが可能。この機能の一環として、画像の自動変換や補正なども可能。近年では、複合機でスキャンされた画像やEメールなど、紙以外の入力にも対応している。

分類 (Classification)

5種類のアルゴリズムがある。このうち、SWTに源流を持つ、画像を使った分類は、事前のOCR処理を必要としないために高速とされ、また同様に対象となる文書で使用されている言語を問わない、ともされる。

  • HPA (High-Precision Anchor: 高精度アンカー): 指定した画像の一部分(複数)を認識して分類
  • 標準 (スタンダード - グラフィックサムネイル): 学習した画像のパターンによって分類
  • 手書き検出: 手書きが多いことを認識して、「手書き」文書と分類
  • キーワード: 文字認識されたテキストから指定されたキーワードで分類
  • テキスト (自動キーワード): 学習した文書構造のパターンから分類

抽出

対象文書の内容すべてをテキスト化する全文抽出、あるいは文書内に存在する特定のフィールドを特定して個別にデータを取り出すAdvanced Recognition(高度な抽出)が可能である。また両抽出機能は排他的ではなく、組み合わせることも可能とされる。Advanced Recognition(高度な抽出)は、ドキュメントタイプと呼ばれるデータモデルと、個別書類のレイアウトに対応するためのテンプレートを組み合わせて行われる。テンプレートには次のような複数のタイプがある。

  • 標準 (スタンダード)
  • HPA (High-Precision Anchor: 高精度アンカー)
  • 一般的(ジェネリック)
  • テキストマッチング

テンプレートでは、各フィールドに対して認識エンジンや補正パラメーターを設定できる。例えば数字フィールドであれば数字に特化したエンジン、英数フィールドであれば英数(欧文)エンジンを適用し、日本語を含むフィールドのみ日本語エンジンを適用することができる。またSDKによって標準提供されているもの以外のエンジンを組み込むことが可能である。

検証

[4] 抽出されたデータを検証するために、Completionクライアント機能が提供されている。検証用画面フォーム(レイアウト)は、データモデルに沿って生成されるが、検証作業を支援するための各種ロジックや外部データベースなどによるチェック機能、選択用のプルダウンなどを組み込むこともできる。また画面上でコメントやマーキングなどを付加するアノテーション機能がある。自動分類の結果を変更したり、ドキュメントの構成を変更したり、抽出できなかった項目に対して画像の領域を指定して認識させたりすることもできる。

配信

データおよびコンテンツを、CSV, XMLやPDF等、各種の形式で出力し、ODBCCMISなどのインターフェース経由でデータベースやコンテンツ管理等の各種システムに連携する機能。

フロー

各種の業務に応じた一連の処理の流れを、フローとしてGUIで定義する機能。これを起動し、実行することによって、自動処理と人的な処理で構成される全体のプロセスが処理されていく。

機械学習

PAL (Production Auto Learning): 適切なテンプレートが存在しない場合に、人的な操作からのデータとイメージの蓄積を学習し、分類・抽出で使用するテンプレートを自動生成する機能。

分散/Web/モバイルキャプチャー

スキャンや検証用のクライアントは、元々事務センターなどでの集中処理向けであり、分散処理には適していない。近年はCaptiva Web Clientと称するWebベースのクライアントも提供されている。またモバイルアプリケーションにキャプチャー機能を組み込むためのSDKが提供されている。

脚注

[脚注の使い方]
  1. ^ 24年間Captivaに携わっているとするJim Hayes (LinkedIn)のプロファイルでの説明による
  2. ^ 2018年8月4日時点
  3. ^ What's New in Capture Overview - Release 16 EP4”. 2018年8月11日閲覧。
  4. ^ 元々、専任の担当者(オペレーター)が、各々に自動的に割り当てられた作業を順次処理していくことが想定されている。

外部リンク

関連項目


OpenText Captiva

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/12/22 00:13 UTC 版)

オープンテキスト」の記事における「OpenText Captiva」の解説

紙および電子媒体データおよびコンテンツとするキャプチャーソリューション。

※この「OpenText Captiva」の解説は、「オープンテキスト」の解説の一部です。
「OpenText Captiva」を含む「オープンテキスト」の記事については、「オープンテキスト」の概要を参照ください。

ウィキペディア小見出し辞書の「OpenText Captiva」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「OpenText Captiva」の関連用語

OpenText Captivaのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



OpenText Captivaのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのCaptiva (ソフトウェア) (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのオープンテキスト (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS