当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

5个月前 (04-02)Deepseek最新资讯454

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

北京大学联合华为发布全栈开源DeepSeek推理方案

北京大学联合华为发布全栈开源DeepSeek推理方案

据北京大学网站消息,近日,北京大学联合华为发布DeepSeek全栈开源推理方案。该方案基于北京大学自主研发的SCOW算力平台系统与鹤思调度系统,整合了DeepSeek、openEuler、MindSp...

托普云农:目前暂无与DeepSeek合作计划

托普云农:目前暂无与DeepSeek合作计划

每经AI快讯,托普云农(301556)2月24日在互动平台表示,公司一直积极关注行业内的技术发展,但目前暂无与DeepSeek合作计划。未来,公司将持续深耕智慧农业行业,提升技术水平,在农业大数据分析...

如何在1分钟内无需DeepSeek就能生成8张海报?

如何在1分钟内无需DeepSeek就能生成8张海报?

随着技术的不断发展,AI已逐渐渗透到各个行业,其中,海报设计作为一个视觉创意领域,也迎来了AI的革新。秒出设计便是一款利用人工智能技术,能够帮助用户快速生成高质量海报的工具。这款产品的核心优势在于其智...

东风日产Nissan OS接入DeepSeek

东风日产Nissan OS接入DeepSeek

每经快讯,在4月27日的东风日产N7上市发布会上,东风日产宣布其旗下车机系统Nissan OS 当日正式接入DeepSeek。该车机系统将搭载在今日上市的东风日产N7,售价区间为11.99万元至14....

DeepSeek助力省生态环境信息化及指挥调度中心项目提档升级

DeepSeek助力省生态环境信息化及指挥调度中心项目提档升级

近日,为落实副省长余建提出的加快革新、标准先行、统筹推动、注重运用、确保安全工作要求,推进DeepSeek大语言AI模型在生态环境领域落地转化,省生态环境厅一级巡视员林奇昌组织深入研究如何加快Deep...

DeepSeek让观山湖区政务服务实现“边聊边办”

DeepSeek让观山湖区政务服务实现“边聊边办”

近期,贵州省政务服务中心依托国产大模型DeepSeek开发的“贵人智办”AI助手上线,观山湖区作为全省首批试点之一,该功能也在区政务大厅正式亮相。记者走进观山湖区政务大厅看到,B区的自助办理区及“7×...