Looking for dataset to test FULLTEXT style searches on(寻找数据集以测试 FULLTEXT 样式搜索)
问题描述
我正在寻找一个文本语料库来运行一些试验全文样式数据搜索.要么是我可以下载的东西,要么是生成它的系统.更随机的东西会更好,例如1,000,000 篇维基百科文章,格式易于插入 2 列数据库(id、文本).
I am looking for a corpus of text to run some trial fulltext style data searches across. Either something I can download, or a system that generates it. Something a bit more random would be better e.g. 1,000,000 wikipedia articles in a format easy to insert into a 2 column database (id, text).
有什么想法或建议吗?
推荐答案
因为我熟悉它,所以我会把它扔出去 - Prosper.com 提供他们的会员贷款列表以供分析 通过 XML 导出.导出将包含大约 50,000 个带有描述的贷款请求和超过 1,000,000 个成员资料(尽管其中许多是空的).
I'll throw this out there since I'm familiar with it - Prosper.com makes their member loan listings available for analysis through an XML export. The export would have about 50,000 loan requests with descriptions and over 1,000,000 member profiles (although many of those are empty).
这篇关于寻找数据集以测试 FULLTEXT 样式搜索的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:寻找数据集以测试 FULLTEXT 样式搜索
基础教程推荐
- 是否可以执行按位分组功能? 2021-01-01
- SQL:使用来自具有相同列名的两个表中的数据... 2021-01-01
- SSMS 中的权限问题:“对象 'extended_properties'、数据库 'mssqlsystem_resource'、... 错误 229)上的 SELECT 权限被拒绝" 2022-01-01
- SQL Server 实例在登录协商期间返回无效或不受支持的协议版本 2021-01-01
- 需要 MySQL 5.1 中的抽象触发器来更新审计日志 2021-01-01
- 如何使用 mysql.connector 禁用查询缓存 2022-01-01
- SQL 效率:WHERE IN 子查询 vs. JOIN 然后 GROUP 2021-01-01
- 将 SQL Server DateTime 列迁移到 DateTimeOffset 2021-01-01
- 无法解决整理冲突 2021-01-01
- 在 SQL 中连接多个表 2021-01-01
