+ -
当前位置:首页 → 问答吧 → 如何将每场14匹马过往赛绩资料汇入excel

如何将每场14匹马过往赛绩资料汇入excel

时间:2014-07-20

来源:互联网

除了用以下网址外+web query外

有无人知马会会提供xml版马匹资料?

我想将每一场14匹马的过往赛绩汇入excel作分析

现在做法超傻, 人手方法拉资料入excel (超浪费时间), 再用piovt table分析

[ 本帖最后由 肇事兄弟 於 2014-7-2 11:21 AM 编辑 ]
附件 Untitled.png (178.14 KB)

2014-7-2 11:12 AM

Untitled.png (178.14 KB)

2014-7-2 11:12 AM

作者: 肇事兄弟   发布时间: 2014-07-20

引用:原帖由 肇事兄弟 於 2014-7-2 11:12 AM 发表
除了用以下网址外+web query外

有无人知马会会提供xml版马匹资料?

我想将每一场14匹马的过往赛绩汇入excel作分析

现在做法超傻, 人手方法拉资料入excel (超浪费时间), 再用piovt table分析
XML 从那里下载的?

作者: ceap2003   发布时间: 2014-07-20

以前好多网页页都会细分资料放便外部汇入资料更新,但依家大多只可以整页输入,令Excel无用之地

作者: alee001   发布时间: 2014-07-21

之前呢度有人讲开用 phantomJS 拎, 拎晒啲 html 返嚟先

作者: a8d7e8   发布时间: 2014-07-21

Any idea?

作者: kengdluck   发布时间: 2014-07-21

excel都可以做到

作者: r.bb2   发布时间: 2014-07-21

vba

作者: r.bb2   发布时间: 2014-07-21

睇来唔用xml, pull html source一样得.

作者: 111x111=12321   发布时间: 2014-07-21

use programming.

作者: worlddupbaby   发布时间: 2014-07-21

le 个 post 有提
computer.discuss.com.hk/viewthread.php?tid=23232633 <= 嗰个肥妹仔都系用黎拎 马会 d 资料的。

[ 本帖最后由 林珍儿 於 2014-7-3 08:29 PM 编辑 ]

作者: 林珍儿   发布时间: 2014-07-21

当年我做过罗波盘资料。方法都系大同小异。

个 html source,D资料系
"SelHorse" 张 form 到。

下面基本上系个 table。

好简单。先罗在成个 html,再 parse 张 form SelHorse,跟住分析个 table body。

搞掂。

作者: pc_chai   发布时间: 2014-07-21

引用:原帖由 pc_chai 於 2014-7-4 12:26 PM 发表
当年我做过罗波盘资料。方法都系大同小异。

个 html source,D资料系
"SelHorse" 张 form 到。

下面基本上系个 table。

好简单。先罗在成个 html,再 parse 张 form SelHorse,跟住分析个 table body。
...
hkjc 进化左喇。佢地而加行 ajax,普通 parse html 拎唔到 delay 左既 data

作者: 林珍儿   发布时间: 2014-07-21

我觉得要分析不如张每次赛马结果及派彩汇入excel好过,这个方法好易令人懒,我就系其中一个懒人。
我四年前就想张每次赛马结果及派彩在马会个网复制后贴上在excel,之后在excel执靓去,但四年内的功课因懒只做9月头几日,我都想知有冇得汇入excel,唔洗成日咁麻烦要复制同贴上去excel

作者: TAhug再3回来了   发布时间: 2014-07-21

复制内容到剪贴板代码: ....
string fileName = @"http://www.hkjc.com/chinese/racing/OtherHorse.asp?HorseNo=M119";

var htmlWeb = new HtmlWeb();
htmlWeb.AutoDetectEncoding = true;
var doc = htmlWeb.Load(fileName);

doc.DocumentNode.Descendants()
.Where(n => n.NodeType == HtmlAgilityPack.HtmlNodeType.Comment)
.ToList()
.ForEach(n => n.Remove());

foreach (HtmlNode row in doc.DocumentNode.SelectNodes(@"//table[@class=""bigborder""]//tr"))
{
foreach (HtmlNode col in row.SelectNodes("td"))
{
var text = HttpUtility.HtmlDecode(col.InnerText.Trim().Replace(" ", ""));
Console.Write("{0}{1}", text, ";");
}
Console.WriteLine();
}
....
复制内容到剪贴板代码:场次;名次;日期;马场/跑道/赛道;途程;场地状况;赛事班次;档位;评分;练马师;骑师;头马
距离;独赢赔率;实际负磅;沿途走位;完成时间;排位体重;配备;赛事重播;
13/14马季;
760;01;01/07/2014;田草地"A+3";1200;好;3;3;065;约翰摩亚;梁家俊;1/2;23;118;661;1.0
9.81;1148;TT/CP/H;;
;;
729;06;22/06/2014;田草地"C+3";1200;好;3;4;067;约翰摩亚;梁家俊;5-1/4;23;120;646;1
.10.18;1151;TT/CP/H;;
;;
.....
[ 本帖最后由 form5 於 2014-7-6 03:24 AM 编辑 ]

作者: form5   发布时间: 2014-07-21

oops, no-break space & n b s p ; space cannot display properly inside code tag
复制内容到剪贴板代码: .Replace("& n b s p;" , "")

作者: form5   发布时间: 2014-07-21

引用:原帖由 form5 於 2014-7-6 03:17 AM 发表
....
string fileName = @"http://www.hkjc.com/chinese/racing/OtherHorse.asp?HorseNo=M119";

var htmlWeb = new HtmlWeb();
htmlWeb.AutoDetectEncoding = true;
...
系唔系可以自动张每日结果汇入excel

作者: TAhug再3回来了   发布时间: 2014-07-21

引用:原帖由 TAhug再3回来了 於 2014-7-6 10:42 AM 发表

系唔系可以自动张每日结果汇入excel
加多几行米得囉,或者redirect stdout去csv 又得

作者: form5   发布时间: 2014-07-21