最近正在练习机器学习,发现调参是一件很费时烦人的工作,得知用 spark-sklearn 可以进行分布式工作,正好单位有几台闲置的服务器。请问一下怎样部署它们?每台服务器都应该装什么软件?最好是在 WIN7 操作系统下。
1
lfzark Sep 10, 2018
还是建议在 Linux 下部署
|
2
qfdk PRO 同意一楼
|
3
miscnote Sep 10, 2018
openPAI 了解下这个
|
4
ipwx Sep 10, 2018
最基础的,你需要 Linux,需要 LDAP,需要共享文件系统(比如 MooseFS )。
|
5
ipwx Sep 10, 2018
还加个 Docker,不然装环境特麻烦。
|
6
acone2003 OP 谢谢楼上几位高屋建瓴的回答,但是我对这些都一无所知。我需要的是用最简单的办法让我在几台服务器上运行起来 spark-sklearn 就行,这几台服务器现在都是裸机,每台服务器该怎么办,给一个大致的步骤,或者在哪里有参考资料也行。
|