[17] 構造化データを抽出

adminが2023/10/13 13:19に最終更新

RCA.Activities.Browser.ExtractStructuredData

説明

構造化データの抽出を使用することによって、指定したウェブページから構造化データを抽出することができます。

Browser_ExtractStructuredData

*は必須。

アクティビティの内容

  • 要素を指定*:要素を選択して存在を確認します。このアクティビティによって、要素のロケーションを指定するための文字列変数(セレクタ)が生成されます。

プロパティ

共通

  • エラーでも処理を続ける(ブール):ブール変数は、TrueまたはFalseの2つの値を持っています。
    True:アクティビティ内でエラーが発生した場合でも、残りのプロセス実行が続行されるようにします。
    False(デフォルト):プロセス実行が続行されるのをブロックします。

入力

  • セクレタ(文字列)* :アクティビティの実行時に特定のUI要素を見つけるために使用されるテキストプロパティです。これは実際には、探しているGUI要素とその親の属性を指定するXMLフラグメントです。
  • 抽出するHTML(文字列):このプロパティでは、抽出する必要のある構造データを含むページソースを入力します。「抽出するHTML」フィールドと「NativeBrowser」の両方が入力されている場合は、「NativeBrowser」のデータが優先されます。
  • ブラウザ(Browser):抽出する先の既存のブラウザの変数です。

その他

  • 公開(チェックボックス):チェックすると、このアクティビティのデータがログに表示されます。データの機密性を考慮した上で使用してください。
  • 表示名(文字列):アクティビティ名。アクティビティ名を編集して、コードをより適切に整理および構造化で名称きます。
    例:データを抽出

オプション

  • ページ間の待機時間(整数):次のページが読み込まれるまで待機する時間(秒)。デフォルト値は1000ミリ秒です。ページの読み込み時間が長い場合は、この値を大きくする必要があります。
    例:1000
  • 結果の最大数(整数):抽出される結果の最大数。値が0の場合、識別されたすべての要素が出力に追加されます。デフォルト値は100です。
    例:100
  • 次のページのタイムアウト(整数):次のページが読み込まれるまでの待機時間(ミリ秒)。タイムアウトが発生した場合、ページはそれ以上読み込まれません。デフォルトの時間は30000ミリ秒です。
    例:30000

出力

  • 結果(データテーブル)* :データテーブル型で出力されたデータ。出力名にはスペースを入れないでください。
  
Navigation