大概几十万个一级域名,想要根据域名来给网站分类,如何做到啊?
举例, www.baidu.com ,那就分为搜索网站, www.jd.com ,分为电商网站,以此类推。。。。。。
举例, www.baidu.com ,那就分为搜索网站, www.jd.com ,分为电商网站,以此类推。。。。。。
1
cctv6 Oct 30, 2016 via Android
目测只能手动
机器不大可能知道你的那个域名是什么网站 而且不确定你的那几十万个域名是不是可以访问的 |
2
zachlhb Oct 30, 2016 via Android
这个没办法吧,除非有网址库
|
3
knightdf Oct 30, 2016
这叫根据域名?难道这不叫根据内容?
|
4
puyo Oct 30, 2016
可不可以根据域名对应网站的 description 或者 keywords 来做分类
|
5
murmur Oct 30, 2016
只根据域名无解 还有多少个数字网站呢
|
6
huage Oct 30, 2016
没有办法
|
7
dsg001 Oct 30, 2016
采集域名 alexa 数据, alexa 有分类
|
8
CRight Oct 30, 2016
3721 能做到吧...
|
9
bazingaterry Oct 30, 2016
只能机器学习了?
|
10
huluhulu Oct 30, 2016
采集这些域名的主页,
如果可以,采集主页上的链接页面的内容。 然后 TF-IDF 算法简单算一下,分成几类之后,就可以看看每一类大概是什么内容了。数据挖掘自动化分类的范畴。 |
11
alittletrain Oct 30, 2016
|
12
lhx2008 Oct 30, 2016
@alittletrain 事实上,还真有一个这样搞事的网站 baidu.wf
|
13
alittletrain Oct 30, 2016
@lhx2008 世界之大,无。。。。
|