写了把在线尺子,测试大模型 coding 能力

1 月 7 日
 finekewei
作为 AI 产品经理,找了个纯前端需求看看现在大模型的能力,开发了个在线尺子 https://ruler.im 无痛开发的三天,质量能到 85 分左右,如果我自己写代码,有痛写代码估计得 10 天
1941 次点击
所在节点    分享创造
11 条回复
sillydaddy
1 月 8 日
本来准备收藏的,但是只能用信用卡校准尺子吗?
我看有提到 A4 纸和 US Letter ,但却没有用它们校准的选项。
如果增加一些常见物体的校准,会更实用。比如身份证、硬币之类的。
suhu
1 月 8 日
@sillydaddy 我查了下。。
中国第二代身份证的尺寸是 85.6 毫米(长)× 54.0 毫米(宽)× 1.0 毫米(厚)
所以其实长度是一样的
xiaoming1992
1 月 8 日
说实话,作为一个产品经理做出来的应用,用户体验不应该是这样的:
1. #1 所说的问题,我认为是个问题,因为很多人不知道信用卡和身份证尺寸一致。
2. 校准完成后的测量交互,仅支持点击,不支持滑动微调。
3. 显示尺寸的标签偏移量貌似是个定值,所以当用户选择页面最右边的一些位置是,标签会跑到页面外。
……
win7pro
1 月 8 日
咋一看以为是写了个可以评测各大模型 coding 能力的工具
irrigate2554
1 月 8 日
@win7pro 对,我还以为是调用 N 个大模型让他们画尺子,来测试模型能力。
guiys
1 月 8 日
人们习惯拿尺子比物体,现在是拿着物体比尺子,奇怪的操作。
刻度不贴边,量外界的东西还得靠瞪眼。
finekewei
1 月 8 日
@win7pro 也是在测试大模型能力
finekewei
1 月 8 日
@sillydaddy 身份证和信用卡一样大小;的宽度超出了相当部分屏幕的大小,手头没有信用卡身份证可以先估个值显示刻度拿 A4 来矫正
finekewei
1 月 8 日
@guiys 是有这个问题,于是加了测在线图片的功能作为补充
lozzow
1 月 8 日
可以尝试读取浏览器和设备信息,然后估算一个默认值
finekewei
1 月 8 日
@lozzow 算不准容易干扰人,索性直接取消了那部分

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1183876

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX