夜風のMixedReality

xRと出会って変わった人生と出会った技術を書き残すためのGeekなHoloRangerの居場所

Azure Computer Visionで文字解析を行う その① ORCとは?

本日はAzure調査枠です。

今回はMicrosoft LearnのOCRに従って利用を始めていきます。

〇OCRとは?

OCR(Optical Character Recognition)は光学式文字認識の略です。

OCRを利用するとAIによって画像(もしくは動画)内のテキストを読み取ることで情報をアプリで使用することができます。

ORCはAzureの中で提供されている組み込み済みAI群の中でコンピュータによる視覚的状況処理(Vision)であるComputer Visionと、人間の使用する自然言語を理解し、処理をする自然言語処理が交わるAIの領域になります。

状況を理解するためにテキストが移ったがをうぞ処理するのがComputer Vision、その後の画像から文字を私たちが読み書きする自然な形でデータ化するのが自然言語処理といった利用法です。

〇OCRの利用法

OCRは主に次のようなシナリオで利用されているようです。

・メモを取る

・本屋書類などのアナログな文献をデジタルスキャンする。

・銀行預金の印刷や手書きの小切手をスキャンする

・レシートの内容を読み取り、家計簿をつける。

 近年ではタブレットやスマートフォンの普及にデジタルノートをとるといった人も多くなり、ORCに日常的に触れる場面も多くなってきているように感じます。

〇AzureでOCRを利用する

AzureではComputer Visionサービスによって画像解析機能が提供されています。

 具体的には次のようなAsure サービスを使用します・

・Cognitive Services

Azure Cognitive ServicesはAzureで提供されるコグニティブインテリジェンスの組み込みに役立つAIサービスです。

コグニティブとは、従来コンピュータの世界で理解できていた数値や一部のテキストだけではなく、自然言語、画像、音声、表情など人間が理解できるような状況理解やコミュニケーションに使用される情報を理解支え、その情報をベースにしてさらに推論を行い自ら学習させていくという意味があります。

参考 

www.ibm.com

Azure Cognitive ServiceではAIを使用した主に次のような情報を認識、処理できるようなサービスが展開されています。

・視覚

・音声

・言語

・決定(異常検知・フィルタリング)

・Computer Vison

 ComputerはAzure Cognitive Serviceの一つである視覚を担っています。

 その名の通り、コンピュータの目となる視覚的情報処理を行っています。

〇Computer Visionを使用してテキストを読み取る

〇Cognitive Servicesリソースを作成する

①Azure Portalへログインします。

portal.azure.com

②[+リソースの作成]を選択します。

③検索欄でCognitive Serviceを検索しあⅿス。

④Cognitive Serviceのリソースを作成します。

この際にリージョンは日本のお住いの場所に近い場所、価格はS0を選択します。

⑤デプロイが完了するのを待ちます。

⑥デプロイ完了後はキーとエンドポイントへ移動しサブスクリプションキーとエンドポイントをメモしておきます。

以上でリソースの作成が完了しました。

今回は概要の理解とリソースの作成を行いました。次回テストしていきます。