Class WebsiteCrawlTask

java.lang.Object
com.bytedesk.core.base.BaseEntity
com.bytedesk.kbase.llm_website.crawl.WebsiteCrawlTask
All Implemented Interfaces:
Serializable

@Entity public class WebsiteCrawlTask extends BaseEntity
抓取任务实体
See Also:
  • Field Details

    • serialVersionUID

      private static final long serialVersionUID
      See Also:
    • taskId

      private String taskId
      任务ID
    • websiteUid

      private String websiteUid
      网站UID
    • websiteUrl

      private String websiteUrl
      网站URL
    • status

      private WebsiteCrawlStatus status
      任务状态
    • configJson

      private String configJson
      抓取配置(JSON格式存储)
    • totalPages

      private Integer totalPages
      总页面数
    • processedPages

      private Integer processedPages
      已处理页面数
    • successPages

      private Integer successPages
      成功页面数
    • failedPages

      private Integer failedPages
      失败页面数
    • startTime

      private Long startTime
      开始时间
    • endTime

      private Long endTime
      结束时间
    • errorMessage

      private String errorMessage
      错误信息
    • resultJson

      private String resultJson
      抓取结果(JSON格式存储)
    • lastUpdateTime

      private ZonedDateTime lastUpdateTime
      最后更新时间
    • objectMapper

      private static final com.fasterxml.jackson.databind.ObjectMapper objectMapper
  • Constructor Details

    • WebsiteCrawlTask

      public WebsiteCrawlTask()
  • Method Details

    • setConfig

      public void setConfig(WebsiteCrawlConfig config)
      设置抓取配置
    • getConfig

      public WebsiteCrawlConfig getConfig()
      获取抓取配置
    • setResult

      public void setResult(WebsiteCrawlResult result)
      设置抓取结果
    • getResult

      public WebsiteCrawlResult getResult()
      获取抓取结果
    • getProgressPercent

      public double getProgressPercent()
      获取进度百分比
    • getSuccessRate

      public double getSuccessRate()
      获取成功率
    • getDuration

      public Long getDuration()
      获取持续时间(毫秒)
    • isRunning

      public boolean isRunning()
      是否正在运行
    • isCompleted

      public boolean isCompleted()
      是否已完成