RCA.Activities.Browser.ExtractStructuredData
説明
構造化データの抽出を使用することによって、指定したウェブページから構造化データを抽出することができます。
*は必須。
アクティビティの内容
- 要素を指定*:要素を選択して存在を確認します。このアクティビティによって、要素のロケーションを指定するための文字列変数(セレクタ)が生成されます。
プロパティ
共通
- エラーでも処理を続ける(ブール):ブール変数は、TrueまたはFalseの2つの値を持っています。
True:アクティビティ内でエラーが発生した場合でも、残りのプロセス実行が続行されるようにします。
False(デフォルト):プロセス実行が続行されるのをブロックします。
入力
- セクレタ(文字列)* :アクティビティの実行時に特定のUI要素を見つけるために使用されるテキストプロパティです。これは実際には、探しているGUI要素とその親の属性を指定するXMLフラグメントです。
- 抽出するHTML(文字列):このプロパティでは、抽出する必要のある構造データを含むページソースを入力します。「抽出するHTML」フィールドと「NativeBrowser」の両方が入力されている場合は、「NativeBrowser」のデータが優先されます。
- ブラウザ(Browser):抽出する先の既存のブラウザの変数です。
その他
- 公開(チェックボックス):チェックすると、このアクティビティのデータがログに表示されます。データの機密性を考慮した上で使用してください。
- 表示名(文字列):アクティビティ名。アクティビティ名を編集して、コードをより適切に整理および構造化で名称きます。
例:データを抽出
オプション
- ページ間の待機時間(整数):次のページが読み込まれるまで待機する時間(秒)。デフォルト値は1000ミリ秒です。ページの読み込み時間が長い場合は、この値を大きくする必要があります。
例:1000 - 結果の最大数(整数):抽出される結果の最大数。値が0の場合、識別されたすべての要素が出力に追加されます。デフォルト値は100です。
例:100 - 次のページのタイムアウト(整数):次のページが読み込まれるまでの待機時間(ミリ秒)。タイムアウトが発生した場合、ページはそれ以上読み込まれません。デフォルトの時間は30000ミリ秒です。
例:30000
出力
- 結果(データテーブル)* :データテーブル型で出力されたデータ。出力名にはスペースを入れないでください。