木尧大兄弟 2020-04-26
这是M5预测挑战赛的两个互补比赛之一。你能尽可能准确地估计沃尔玛在美国销售的各种产品的单位销售额吗?如果你对估计同一系列已实现值的不确定性分布感兴趣,一定要查看它的竞争对手
一家商店一年内每月能卖多少露营用具?对于外行来说,在这个水平上计算销售额似乎和预测天气一样困难。这两种预测都依赖科学和历史数据。虽然错误的天气预报可能导致你在晴天带着雨伞,但不准确的商业预报可能导致实际损失或机会损失。在这场竞争中,除了传统的预测方法外,你还面临着使用机器学习来提高预测精度的挑战。
尼科西亚大学马克里奇斯开放预测中心(MOFC)进行前沿预测研究,并提供商业预测培训。它帮助公司实现准确的预测,估计不确定性水平,避免代价高昂的错误,并应用最佳预测实践。商务部以其马克瑞达基斯竞赛而闻名,第一次比赛在20世纪80年代举行。
在第五次迭代的竞争中,您将使用世界上收入最大的公司沃尔玛(Walmart)的分层销售数据来预测未来28天的日销售额。这些数据涵盖了美国三个州(加利福尼亚州、德克萨斯州和威斯康星州)的门店,包括商品级别、部门、产品类别和门店详细信息。此外,它还具有解释变量,如价格、促销、星期几和特殊事件。综合起来,这个健壮的数据集可以用来提高预测精度。
如果成功,你的工作将继续推进预测的理论和实践。所使用的方法可以应用于各种业务领域,例如设置适当的库存或服务级别。通过其业务支持和培训,商务部将帮助分发工具和知识,以便其他人能够实现更准确和更好的校准预测,减少浪费,并能够了解不确定性及其风险影响。
致谢
此外,还要感谢其他合作组织和奖项赞助商、雅典国立技术大学(NTUA)、欧洲工商管理学院(INSEAD)、谷歌、优步和IIF。
更新于2020年3月24日,以澄清使用AMLTs的语言
不能从多个帐户注册到Kaggle,因此不能从多个帐户提交。
不允许在团队之外私下共享代码或数据。如果论坛上的所有参与者都可以使用代码,那么可以共享代码。
允许团队合并,可以由团队领导执行。若要合并,合并组的提交总数必须小于或等于自合并日期起允许的最大值。允许的最大值是每天提交的次数乘以比赛进行的天数。反洗钱小组不得进行团队合并。
最大团队规模为5人。
您每天最多可以提交5个条目。
你可以选择一个最终的意见书进行评判。
开工日期:2020年3月2日
合并截止日期:2020年6月23日11:59pm UTC
报名截止日期:2020年6月23日11:59pm UTC
结束日期(最终提交截止日期):2020年6月30日11:59 PM UTC
竞争专用条款
竞赛名称:M5预测精度
竞赛主办单位:尼科西亚大学
比赛赞助商地址:塞浦路斯,尼科西亚2417,马克多尼蒂斯46号
竞赛网站:https://www.kaggle.com/c/m5-forecasting-accurity
比赛结束时,将向排行榜上表现最好的学生队额外拨款5000美元。学生团队是指至少50%的团队成员是当前全日制学生的团队。
奖品将在2020年12月于美国纽约市举行的M5会议期间分发。
获胜者许可证类型:开源
数据访问和使用:仅限竞争使用
比赛对美国和世界各地的居民开放,但如果你是克里米亚、古巴、伊朗、叙利亚、朝鲜、苏丹的居民,或者受到美国出口管制或制裁,你就不能参加比赛。其他当地的规章制度可能会适用于你,所以请检查你的当地法律,以确保你有资格参加技能竞赛。竞赛赞助商保留在需要时授予其他奖项以符合当地法律的权利。
参加本次比赛即表示您接受本正式比赛规则。
上述竞赛是一项以技能为基础的竞赛,旨在促进和推动数据科学领域的发展。您必须通过竞赛网站注册才能进入。您提交的参赛作品(“参赛作品”)必须符合竞赛网站上的要求。你的投稿将根据比赛网站上描述的评价标准打分。在遵守竞赛规则的前提下,将根据提交的数据科学模型的优点,向得分最高的参赛者颁发奖品(如有)。完整的比赛规则见下文。
除以下一般竞赛规则的规定外,您理解并同意竞赛赞助商要求的这些竞赛特定规则:
1.赢家执照。
根据以下一般规则第11条(获奖者义务),如果您是竞赛获奖者,您特此授予并将授予竞赛赞助商以下与您提交的参赛作品有关的许可:
开放源代码:您在此授权并将授权您的获奖作品和用于根据开放源代码计划批准的许可(见www.Open Source.org)生成作品的源代码,该许可在任何情况下都不限制包含或依赖于该代码或模型的商业使用。
对于您用于生成提交文件的一般商业可用软件,这些软件不归您所有,但可以由竞赛赞助商采购,而无需支付不适当的费用,您无需为该软件授予前一句中的许可。
提供预测服务的公司和那些声称拥有专有软件的公司必须向组织者提供他们的预测是如何作出的详细描述,以及再现他们的预测的来源或执行文件。
鉴于客观性和可复制性的重要性,此类描述和文件对于赢得比赛的任何奖项都是强制性的。在源程序需要保密的情况下,可以提交执行文件,或者,也可以提交具有运行终止日期的源程序
2.自动机器学习工具(AMLT)
本次比赛允许使用自动机器学习工具(“AMLT”)创建提交材料。除本节所述外,不允许在创建提交文件时使用AMLT。
A、 作为AMLT提交
本次竞赛允许在提交资料时使用自动机器学习工具(AMLT)(即Google AutoML、H2O无人驾驶人工智能等)。
个人参与者和团队也可以使用AMLT创建提交,前提是参与者确保他们拥有适当的AMLT许可证并能够遵守规则。
在下文《一般竞争规则》第11节末尾增加以下规定:“使用反洗钱法提交材料的个人参与者和团队可获奖。
但是,为清楚起见,潜在赢家提交的文件必须仍然符合这些规则的要求,包括但不限于A.1节(赢家许可证)、
B、赢家义务,保证、赔偿和发布
1.有约束力的协议
要参加比赛,您必须同意这些官方比赛规则,这些规则通过引用将比赛网站的规定和内容以及上述任何具体的比赛规则(统称为“规则”)纳入其中。请在进入前仔细阅读这些规则,以确保您理解并同意。您进一步同意,提交参赛作品即构成对本规则的同意。除非您同意这些规则,否则您不能提交参赛作品,也没有资格获得与本次比赛相关的奖品(“奖品”)。这些规则构成您和竞赛赞助商之间关于竞赛的有约束力的法律协议。
2.资格
A、 要获得参赛资格,您必须是:
(i)Kaggle.com的注册账户持有人;
(ii)您所在司法管辖区的18岁以上或成年(除非竞赛赞助商另有约定,并且竞赛赞助商已获得适当的家长/监护人同意);
(iii)不是克里米亚、古巴、伊朗、叙利亚、朝鲜或苏丹的居民;
(iv)不是美国出口管制或制裁实体的个人或代表(见https://www.treasury.gov/resource center/resolutions/Programs/Pages/Programs.aspx)。
如果您是作为公司、教育机构或其他法律实体的代表,或代表您的雇主,这些规则对您个人以及您所代表的实体或您是雇员具有约束力。
如果您在您的工作范围内,作为另一方的雇员、承包商或代理人行事,您保证该方完全了解您的行为并同意您的行为,包括您可能收到的奖金。
您进一步保证,您的行为不会违反您的雇主或实体的政策和程序。
大赛主办单位保留随时核实参赛资格和裁决任何争议的权利。
如果您提供与比赛有关的任何虚假信息,涉及您的身份、居住、邮寄地址、电话号码、电子邮件地址、权利归属或参加比赛所需的信息,您可能会立即被取消比赛资格。
B、 除非上述具体竞争规则另有规定或竞争实体的内部政策禁止,竞争实体的雇员、实习生、承包商、官员和董事可以参加竞争,但没有资格赢得任何奖品。
“竞争实体”是指竞争发起人Kaggle Inc.及其各自的母公司、子公司和附属公司。如果您是竞争实体的参与者,则您必须遵守雇主关于您的参与的所有适用的内部政策。
3.赞助商和主办平台。
比赛由上述比赛赞助商赞助。比赛由Kaggle公司(以下简称“Kaggle”)代表比赛赞助商主办。Kaggle是竞争赞助商的独立承包商,不是本协议或您与竞争赞助商之间的任何协议的一方。您明白,Kaggle对选择潜在的竞赛获胜者或颁发任何奖品不承担任何责任。Kaggle将履行与主办比赛有关的某些行政职能,您同意遵守本规则中与Kaggle有关的规定。作为Kaggle.com帐户持有人和Kaggle竞争平台的用户,请记住,除了这些规则之外,您已经接受并遵守Kaggle服务条款,网址为www.Kaggle.com/Terms。
4.比赛期间。
就奖品而言,比赛将从开始日期和时间持续到结束日期和时间(该期限称为“比赛期”)。比赛时间表可能会有所改变,比赛赞助商可能会在比赛期间引入额外的障碍期限。任何更新或附加的截止日期将在竞赛网站上公布。您有责任定期查看竞赛网站,随时了解截止日期的变化。您负责确定您所在位置的相应时区。
5.比赛入场。
无需购买进入或赢取。参赛者必须在报名截止日期前在竞赛网站注册,并按照竞赛网站上有关开发和输入参赛作品的说明进行操作。
您的提交必须以竞赛网站上规定的方式和格式,并符合所有其他要求(“要求”)。参赛作品必须在比赛网站上规定的截止日期前收到。未在规定期限内收到的投稿将没有资格获得奖品。
提交文件不得使用或合并来自验证数据集或测试数据记录的手工标记或人工预测的信息。
如果比赛是具有暂时分开的训练和/或测试数据的多阶段比赛,则可在每个比赛阶段要求以比赛网站上描述的方式提交一份或多份有效的材料,以便提交的材料符合获奖资格。
如果提交文件的全部或部分内容难以辨认、不完整、损坏、涂改、伪造、通过欺诈或延迟获得,则提交文件无效。竞赛主办单位有权取消任何不遵守本规则的参赛者的参赛资格,包括提交不符合要求的参赛作品。
6.个人和团队。
A、 个人账户。您只能在一个唯一的Kaggle.com帐户下提交。如果您通过一个以上的Kaggle帐户提交资料,或试图伪造帐户作为您的代理,您将被取消资格。您可以按照竞赛网站上的规定每天提交最多数量的参赛作品。
B、 团队。如果竞赛网站指南允许,多个人可以作为一个团队(简称“团队”)协作;但是,您可以加入或组成一个团队。每个团队成员必须是一个单独的个人,有一个单独的Kaggle帐户。在加入一个队之前,你必须单独报名参加比赛。您必须通过回复发送到您的Kaggle帐户的团队通知消息来确认您的团队成员资格,使其成为正式成员。团队成员不得超过比赛网站规定的最大团队规模。
C、 团队合并。参赛队伍可透过比赛网页要求合并。可允许团队合并,但条件是:(i)合并团队不超过最大团队规模;(ii)合并团队提交的申请数量不超过合并请求之日一个团队允许提交的申请数量;(iii)合并在任何合并期限或竞争期限之前完成;以及(iv)拟议的合并团队在其他方面符合本规则的所有要求。
7.竞争数据。
“竞赛数据”是指竞赛网站上用于竞赛的数据或数据集,包括竞赛网站上提供的任何原型或可执行代码。竞赛数据将包含私人和公共测试集。哪些数据属于哪些集合将不提供给参与者。
A、 数据访问和使用。您只能在参加比赛和Kaggle.com论坛上访问和使用比赛数据。竞赛主办单位有权取消除竞赛网站和本规则允许外使用竞赛资料的参赛者的参赛资格。
B、 数据安全。您同意采取合理和适当的措施,防止未正式同意本规则的人员获取竞争数据。您同意不向任何未参加比赛的一方发送、复制、发布、重新分发或以其他方式提供或提供比赛数据。您同意在得知任何可能的未经授权的竞争数据传输或未经授权的访问时立即通知Kaggle,并同意与Kaggle合作纠正任何未经授权的传输或访问。
C、 外部数据。您可以使用竞争数据以外的数据(“外部数据”)来开发和测试您的模型和提交的内容。但是,您将(i)确保所有参赛者都可以使用外部数据进行比赛,其他参赛者不承担任何费用,并且(ii)在报名截止日期之前,将参赛者对外部数据的访问发布到官方比赛论坛。
8.提交代码要求。
A、 私有代码共享。除非竞赛网站或上述竞赛规则另有特别许可,否则在竞赛期间,您不得私自共享与竞赛数据相关或基于竞赛数据或与竞赛相关的其他源代码或可执行代码开发的源代码或可执行代码(“竞赛代码”)。
这项禁令包括在不同团队之间共享竞争代码,除非发生团队合并。任何此类共享竞争守则的行为都违反了这些竞争规则,可能导致取消资格。
B、 公共代码共享。你可以公开分享竞争守则,但这种公开分享不得侵犯任何第三方的知识产权。
如果您选择共享竞争代码或其他此类代码,则需要在Kaggle.com上的讨论论坛或与竞争相关的内核上共享,以使所有竞争对手受益。
通过这样的共享,您将被视为已根据开放源代码计划批准的许可证(见www.Open Source.org)授权共享代码,在任何情况 下都不限制包含或依赖于此类竞争代码的此类竞争代码或模型的商业使用。
B、 公共代码共享。你可以公开分享竞争守则,但这种公开分享不得侵犯任何第三方的知识产权。如果您选择共享竞争代码或其他此类代码,则需要在Kaggle.com上的讨论论坛或与竞争相关的内核上共享,以使所有竞争对手受益。通过这样的共享,您将被视为已根据开放源代码计划批准的许可证(见www.Open Source.org)授权共享代码,在任何情况下都不限制包含或依赖于此类竞争代码的此类竞争代码或模型的商业使用。
C、 使用开源。除非上述特定竞争规则中另有规定,如果在模型中使用开放源代码生成提交,则您只能使用根据开放源代码计划批准的许可证(见www.open source.org)授权的开放源代码,该许可证在任何情况下都不限制包含或依赖于该许可证的此类代码或模型的商业使用代码。
9.决定胜负。
每次投稿都将按照竞赛网站上规定的评价标准进行评分和排名。在比赛期间,目前的排名将在比赛网站的公开排行榜上可见。潜在赢家仅由私人排行榜上的排行榜排名决定,但须遵守这些规则。
公共排行榜将基于公共测试集,而私有排行榜将基于私有测试集。
在平局的情况下,首先进入比赛的投稿将是赢家。如果潜在赢家因任何原因被取消资格,则获得下一个最高得分排名的提交将被选为潜在赢家。
10.获奖通知及取消资格。
潜在获胜者将通过电子邮件通知。
如果潜在赢家(i)在第一次通知尝试后的一(1)周内未对通知尝试作出回应,或(ii)在结束日期后的一周内通知Kaggle潜在赢家不希望被提名为赢家或不希望获得奖品,则在每种情况下(i)和(ii)该潜在赢家将不接受任何奖品,候补潜在获胜者将根据比赛的评判标准从所有符合条件的参赛作品中选出。
在上述(i)和(ii)情况下,Kaggle可取消参与者的资格。但是,在上述第(ii)种情况下,如果Kaggle要求,该潜在赢家可提供代码和文件,以验证参与者是否遵守这些规则。如果潜在赢家提供的代码和文件令Kaggle满意,则根据本款,参与者将不会被取消资格。
如果竞赛主办人合理地认为参赛者企图通过欺骗、欺骗或其他不正当的竞赛行为或滥用、威胁或骚扰任何其他参赛者来破坏竞赛的合法运作,则竞赛主办人有权取消任何参赛者的参赛资格,竞赛赞助商或Kaggle。
被取消资格的参赛者可自行决定从竞赛排行榜中除名。如果参赛者被从竞赛排行榜中删除,则与Kaggle竞赛平台相关的其他获胜特征,例如Kaggle积分或奖牌,也可能不会被授予。
最终的排行榜名单将在Kaggle.com上公布。竞赛主办单位的决定是终局的,具有约束力。
11.赢家的义务。
作为获奖的条件,获奖者必须履行下列义务:
(a) 向竞赛赞助商交付最终模型的软件代码,用于生成获奖提交文件和相关文档。交付的软件代码应遵循这些文档指南,必须能够生成成功的提交,并包含成功构建和/或运行可执行代码所需资源的描述。如果最终模型的软件代码包括一般商业上可获得的软件,但这些软件不是您拥有的,但可以由竞赛赞助商购买,而无需支付不适当的费用,那么您必须确定该软件的代码、购买方法,而不是将该软件的代码交付给竞赛赞助商,以及复制中标申请书所需的任何参数或其他信息;
(b) 向竞赛赞助商授予上述竞赛专用规则中规定的获奖作品的许可证,并声明您有权授予该许可证;
(c) 签署并返还竞赛赞助商或Kaggle可能要求的所有获奖文件,包括但不限于:(i)资格证明;(ii)许可证、放行单和规则要求的其他协议;和(iii)美国税务表格(如美国居民为美国国税局表格W-9,外国居民为美国国税局表格W-8BEN,或未来等价物)。
12.奖品。
奖品如比赛网站所述,只可在比赛网站所述的时间段内获得。得奖的几率取决于比赛期间收到的合格投稿的数量和参赛者的技能。
所有奖品均须由竞赛主办人审查及核实参赛者的资格及是否符合本规则,以及得奖作品是否符合参赛要求。如果参赛作品不符合本竞赛规则,竞赛赞助商可自行决定采取下列任一行动:
(i)取消参赛作品的参赛资格;
(ii)要求潜在获奖者在收到通知后一周内纠正参赛作品中发现的所有问题(包括,但不限于解决许可冲突、履行软件许可所要求的所有义务以及删除任何违反软件限制的软件)。
根据第10条,潜在获胜者可拒绝被提名为竞赛获胜者。
潜在获奖者必须在收到所需文件通知后的两(2)周内归还所有所需的获奖文件,否则该潜在获奖者将被视为已被没收奖品,并将选出另一个潜在获奖者。奖品将在竞赛赞助商或Kaggle收到所需的获奖文件后大约30天内颁发。不允许转移或分配奖品。
如果您不符合以上第2节中的资格要求,您就没有资格获得任何奖品。
如果一个团队赢得了货币奖,奖金将在合格团队成员之间以偶数股的形式分配,除非团队一致选择不同的奖金分配,并在颁发奖金前通知Kaggle。
13.税。
对奖品征收的所有税款都是获奖者的唯一责任。支付给潜在赢家的款项必须明确要求他们提交竞赛赞助商或Kaggle要求的所有文件,以符合适用的州、联邦、地方和外国(包括省级)税务报告和预扣税要求。奖品将扣除法律要求竞赛赞助商代扣的任何税款。如果潜在赢家未能提供任何要求的文件或遵守适用的法律,奖品将被没收,竞赛赞助商可选择其他潜在赢家。任何是美国居民的获奖者都将收到美国国税局1099号表格,金额与他们的奖金相当。
14.一般条件。
所有联邦、州、省和地方法律法规均适用。
15.宣传。
您同意竞赛赞助商、Kaggle及其附属公司可以使用您的姓名和肖像进行广告和宣传,无需额外赔偿,除非法律禁止。
16.隐私
您承认并同意竞赛赞助商和Kaggle可以收集、存储、共享和以其他方式使用您在Kaggle帐户注册过程和竞赛期间提供的个人识别信息,包括但不限于姓名、邮寄地址、电话号码和电子邮件地址(“个人信息”)。Kaggle在收集、存储、共享和其他使用本个人信息方面充当独立的控制者,并将根据其隐私政策使用本个人信息<www.Kaggle.com/Privacy>,包括管理竞争。作为Kaggle.com帐户持有人,您有权通过登录您的帐户和/或通过<www.Kaggle.com/contact>联系Kaggle支持,请求访问、审查、更正、可移植性或删除Kaggle持有的关于您的任何个人数据。
作为竞赛赞助商履行您与竞赛赞助商之间本合同的一部分,Kaggle将向竞赛赞助商转让您的个人信息,竞赛赞助商将作为与此个人信息相关的独立控制者。作为此类个人信息的控制者,竞赛赞助商同意遵守与您的个人信息有关的所有美国和外国数据保护义务。Kaggle将把您的个人信息传送到上述竞赛赞助商地址中指定的国家的竞赛赞助商,该国家可能是您居住国家以外的国家。此类国家可能没有与您居住国家类似的隐私法律法规。
17.保证、赔偿和免除。
您保证您的提交是您自己的原创作品,因此,您是提交的唯一和唯一所有者和权利持有人,您有权提交并授予所有必需的许可证。您同意不提交以下内容:(i)侵犯任何第三方的所有权、知识产权、工业产权、个人或道德权利或任何其他权利,包括但不限于版权、商标、专利、商业秘密、隐私、公开或保密义务,或诽谤任何人;或(ii)违反任何适用的美国或外国州或联邦法律。
在法律允许的最大范围内,您对因您的任何行为、违约或不作为和/或违反本协议规定的任何保证而导致的任何责任、索赔、要求、损失、损害、成本和费用进行赔偿,并同意随时让受赔偿的竞争实体免于承担这些责任、索赔、要求、损失、损害、成本和费用。在法律允许的最大范围内,您同意保护、赔偿并使竞争实体免受任何和所有索赔、诉讼、起诉或诉讼,以及任何和所有损失、责任、损害,由以下原因引起或产生的成本和费用(包括合理的律师费):(a)您提交的或您上传或以其他方式提供的侵犯任何第三方所有权、知识产权、工业产权、人身或精神权利或任何其他权利的材料,包括但不限于版权、商标、专利、商业秘密、隐私、公开或保密义务,或诽谤任何人;(b)您在竞争中作出的任何虚假陈述;(c)您不遵守本规则或任何适用的美国或外国或联邦法律;(d) 非本规则缔约方的个人或实体因您参与竞赛而提出的索赔;以及(e)您接受、拥有、滥用或使用任何奖品,或您参与竞赛和任何与竞赛有关的活动。
您在此免除竞赛实体与下列事项有关的任何责任:(a)竞赛网站的任何故障或其他问题;(b)任何提交资料的收集、处理或保留中的任何错误;或(c)任何获奖者的印刷、提供或宣布中的任何印刷或其他错误。
18.互联网。
竞赛实体不对竞赛网站的任何故障或由于系统错误、计算机故障、不完整或混乱或其他电信传输故障而导致的任何迟交、丢失、损坏、误导、不完整、难以辨认、无法送达或销毁的提交材料或参赛材料负责,任何类型的硬件或软件故障、网络连接丢失或不可用、印刷或系统/人为错误和故障、任何电话网络或线路的技术故障、电缆连接、卫星传输、服务器或提供商、或计算机设备、互联网或竞赛网站上的交通堵塞,或其任何组合,可能限制参与者的参与能力。
19.取消、修改或取消资格的权利。
如果由于任何原因,比赛无法按计划进行,包括受到计算机病毒、漏洞、篡改、未经授权的干预、欺诈、技术故障或任何其他原因的感染,这些原因会破坏或影响比赛的管理、安全、公平、完整或正当进行,大赛主办单位保留取消、终止、修改或暂停比赛的权利。竞赛主办单位有权取消任何干扰参赛者提交过程或竞赛网站任何其他部分的参赛资格。参赛者故意破坏包括竞赛网站在内的任何网站,或者破坏竞赛合法运作的任何企图,都是违反刑法和民法的行为。如果有此企图,竞赛赞助商和Kaggle各自保留在适用法律的最大范围内向任何此类参与者寻求损害赔偿的权利。
20.不是雇佣合同。
在任何情况下,参赛作品、颁奖或本规则中的任何内容均不得解释为与竞赛赞助商或任何竞赛实体的要约或雇佣合同。您承认您是自愿提交的,而不是以保密或信任的方式提交的。您承认,您接受本规则或您提交的材料,不会在您与竞赛赞助商或任何竞赛实体之间建立任何机密、信托、代理、雇佣或其他类似关系。
21.适用法律。
除非上述特定竞争规则另有规定,否则由这些规则引起或与之相关的所有索赔将受加利福尼亚州法律管辖,不包括其法律冲突规则,并将仅在加利福尼亚州圣克拉拉县的联邦或州法院提起诉讼,美国。双方同意在这些法院行使属人管辖权。如果本规则的任何规定被视为无效或不可执行,则本规则的所有其余规定将继续完全有效。