構造化データを抽出

adminが2023/10/13 13:56に最終更新

RCA.Activities.Common.ExtractStructuredData

説明

構造化データの抽出を使用することによって、指定したウェブページから構造化データを抽出することができます。

image-20220505134517-1.png

*は必須。

アクティビティの内容

  • ウィザードを開く* :要素を選択して存在を確認します。このアクティビティによって、要素のロケーションを指定するための文字列変数(セレクタ)が生成されます。

プロパティ

共通

  • エラーでも処理を続ける(ブール):エラーが発生した場合でも、自動化を続行するか指定します。TrueまたはFalseの値のみあります。True:アクティビティ内でエラーが発生した場合でも、残りのプロセス実行が続行されるようにします。False(デフォルト):プロセス実行が続行されるのをブロックします。
  • 実行後の待機時間(整数):アクティビティを実行した後の遅延時間(ミリ秒)です。デフォルトの時間は300ミリ秒です。
    例:300
  • 実行前の待機時間(整数):アクティビティが何らかの操作を開始するまでの遅延時間(ミリ秒)です。デフォルトの時間は200ミリ秒です。
    例:200

入力

  • セレクター(文字列):データテーブル型で出力されたデータ。

その他

  • 表示名(文字列):アクティビティ名。アクティビティ名を編集して、コードをより適切に整理および構造化で名称きます。
  • 公開(チェックボックス):公開したい場合はチェックを入れます。使用前に、必ずデータセキュリティ要件を考慮してください。デフォルトはチェックがありません。

オプション

  • ページ間の待機時間(整数):次のページが読み込まれるまで待機する時間(ミリ秒)。デフォルト値は1000ミリ秒です。ページの読み込み時間が長い場合は、この値を大きくする必要があります。
    例:1000
  • 結果の最大数(整数):抽出される結果の最大数。値が0の場合、識別されたすべての要素が出力に追加されます。デフォルト値は100です。
    例:100
  • 次のページのタイムアウト(整数):次のページが読み込まれるまでの待機時間(ミリ秒)。タイムアウトが発生した場合、ページはそれ以上読み込まれません。デフォルトの時間は30000ミリ秒です。入力値が0以下の場合、タイムアウト時間は30000(ミリ秒)になります。
    例:30000

出力

  • 結果(データテーブル):データテーブル型で出力されたデータ。
  
Navigation