+ -
当前位置:首页 → 问答吧 → 我老细要我去test youtube 个 algorithm, 唔知点算,救命...

我老细要我去test youtube 个 algorithm, 唔知点算,救命...

时间:2013-05-27

来源:互联网

是咁的..

Youtube 在几个月前改在排序算法, 简单来说就是会比较侧重番video播放时间, 而非点击率.
for example. 如果某video点击率可能有一千,但每个click 入去的人,睇三秒就即走.
但有另一条片. 点击率只有一百, 但每个click 入去的人,都睇晒5分钟至走,
咁既情况之下,后者会排得高d. 因为后者真系一段直得睇的video.


我老细要我test youtube 的排序, 起码在要某个keyword领域里, 系可以随心所欲推上推落.
咁我就upload五十条dummy 去youtube去test 啦.
每条片的命名规则就系咁 ,  ABCDEFG(2013-05-01), ABCDEFG(2013-05-02)...
咁如果我在youtube search bar搵 ABCDEFG, 无错系会搵到我upload 的dummy 片,
但youtube 系乱排的. 一唔跟file名排,二唔跟upload 日期排.
但次序似乎是固定不变, 即是说放在仓底的片,永远都是放在仓底

老细叫我test youtube 排序到底系点function
咁我就用vbs 写左个program , 分俾八部电脑一共八个IP去用, 每晚自动开个internet explorer 出黎扮点击左某片,
而且系每条片都睇足十分钟先至close 个internet explorer
我选左放在仓底的片去点击, 务求令到仓底货排番前d. , 一个月以来,仓底片已有过百点击率. 但依然系排在仓底, 完全无上过位.

我知道youtube 有一个搜寻选项,排序依据可以跟「上传日期」排,亦可以跟「观看次数」排,
但老细坚持就算系用番youtube 预设的排序依据「关联性」.仍然可以人为咁推上推落.
(因为无理由要浏灠者去自己选「排序依据」)

衣家变左一个困局, 我都唔知点算.

作者: chrislam177   发布时间: 2013-05-27

呢个系一个 Test of Hypothesis

你要定义你系专家定佢系专家 (or both or neither)

如果你认为你系专家...
你一系改进「我选左放在仓底的片去点击, 务求令到仓底货排番前d. , 一个月以来,仓底片已有过百点击率. 但依然系排在仓底, 完全无上过位」再试.
你一系对老细宣称,  已「证明」个假设系错既 !!

如果你认为佢系专家...
你请教佢点样编排另一个更好的 Test.

[ 本帖最后由 Pseudo 於 2013-5-27 04:46 PM 编辑 ]

作者: Pseudo   发布时间: 2013-05-27

试到又点??? 你有几多个乾净的 IP?

等 youtube 俾你用钱买 ranking 先算.

作者: a8d7e8   发布时间: 2013-05-27

引用:
原帖由 chrislam177 於 2013-5-27 04:36 PM 发表
是咁的..

Youtube 在几个月前改在排序算法, 简单来说就是会比较侧重番video播放时间, 而非点击率.
for example. 如果某video点击率可能有一千,但每个click 入去的人,睇三秒就即走.
但有另一条片. 点击率只有一 ...
你或你老板想到的“改善”排名方法, YouTube 的 developer 大概不可能想不到。
你看看 Google Analytics 可以 extract 到几多资料就知。
扮普通 user 看 YouTube 可以扮得几似?
是冇 history 的 user ?
还是次次都是相同 IP ?
两样都中的话,大概所作的“改善”不会有作用吧?

作者: xianrenb   发布时间: 2013-05-27

引用:
原帖由 a8d7e8 於 2013-5-27 05:36 PM 发表
试到又点??? 你有几多个乾净的 IP?

等 youtube 俾你用钱买 ranking 先算.
呢个好简单姐, 用 pccw 果 d adsl plan 咪得囉, 睇一睇, disconnect, 拿新 ip, 再睇 所以 6m 收 218 hkd , 系有佢既 "商业" 价值。

我怀疑果 d 韩国 MV 都系用呢 d 方法, 造到过亿 click rate

作者: p_net   发布时间: 2013-05-27

俾我系 youtube dev 会做 adaptive rating - local(same ISP/subnet/etc) 个 stat 不能代表 global(global-wise, Asia-wise, HK-wise).

还有一点楼上提到的 user history, 亦都系好有参考价值. 等同 discuss 常见的"新人", 你都唔会信佢咁多啦?
引用:
原帖由 p_net 於 2013-5-27 18:15 发表
呢个好简单姐, 用 pccw 果 d adsl plan 咪得囉, 睇一睇, disconnect, 拿新 ip, 再睇 所以 6m 收 218 hkd , 系有佢既 "商业" 价值。

我怀疑果 d 韩国 MV 都系用呢 d 方法, 造到过亿 click rate

作者: a8d7e8   发布时间: 2013-05-27

引用:
原帖由 a8d7e8 於 2013-5-27 06:29 PM 发表
俾我系 youtube dev 会做 adaptive rating - local(same ISP/subnet/etc) 个 stat 不能代表 global(global-wise, Asia-wise, HK-wise).
这只是怕有 noise, 所以用很高的 noise reduction ratio, 个结果只会搞到 d 音质好少 noise, 但好怪, 好不自然。问题是解决不了, 只系你想要少 noise + 怪声, or 多 noise + 自然声

作者: p_net   发布时间: 2013-05-27

咁又真喎.

可能现实中真系有啲地区/社区性点击.edit: 咪住先, adaptive 意思咪就系用返近似的 stat 去做比较囉?????? 同 local 比而唔同 global 比.
引用:
原帖由 p_net 於 2013-5-27 19:08 发表
这只是怕有 noise, 所以用很高的 noise reduction ratio, 个结果只会搞到 d 音质好少 noise, 但好怪, 好不自然。问题是解决不了, 只系你想要少 noise + 怪声, or 多 noise + 自然声
[ 本帖最后由 a8d7e8 於 2013-5-27 07:24 PM 编辑 ]

作者: a8d7e8   发布时间: 2013-05-27

热门下载

更多