[17] 構造化データを抽出

adminが2023/10/13 13:19に最終更新

RCA.Activities.Browser.ExtractStructuredData

説明

構造化データの抽出を使用することによって、指定したウェブページから構造化データを抽出することができます。

Browser_ExtractStructuredData

*は必須。

アクティビティの内容

要素を指定*：要素を選択して存在を確認します。このアクティビティによって、要素のロケーションを指定するための文字列変数（セレクタ）が生成されます。

プロパティ

共通

エラーでも処理を続ける（ブール）：ブール変数は、TrueまたはFalseの2つの値を持っています。
True：アクティビティ内でエラーが発生した場合でも、残りのプロセス実行が続行されるようにします。
False（デフォルト）：プロセス実行が続行されるのをブロックします。

入力

セクレタ（文字列）* ：アクティビティの実行時に特定のUI要素を見つけるために使用されるテキストプロパティです。これは実際には、探しているGUI要素とその親の属性を指定するXMLフラグメントです。
抽出するHTML（文字列）：このプロパティでは、抽出する必要のある構造データを含むページソースを入力します。「抽出するHTML」フィールドと「NativeBrowser」の両方が入力されている場合は、「NativeBrowser」のデータが優先されます。
ブラウザ（Browser）：抽出する先の既存のブラウザの変数です。

その他

公開（チェックボックス）：チェックすると、このアクティビティのデータがログに表示されます。データの機密性を考慮した上で使用してください。
表示名（文字列）：アクティビティ名。アクティビティ名を編集して、コードをより適切に整理および構造化で名称きます。
例：データを抽出

オプション

ページ間の待機時間（整数）：次のページが読み込まれるまで待機する時間（秒）。デフォルト値は1000ミリ秒です。ページの読み込み時間が長い場合は、この値を大きくする必要があります。
例：1000
結果の最大数（整数）：抽出される結果の最大数。値が0の場合、識別されたすべての要素が出力に追加されます。デフォルト値は100です。
例：100
次のページのタイムアウト（整数）：次のページが読み込まれるまでの待機時間（ミリ秒）。タイムアウトが発生した場合、ページはそれ以上読み込まれません。デフォルトの時間は30000ミリ秒です。
例：30000

出力

結果（データテーブル）* ：データテーブル型で出力されたデータ。出力名にはスペースを入れないでください。

目次

説明
アクティビティの内容
プロパティ

Navigation

akaBot Docs powered by xwiki 15.6