双重边际效应例子(双重边际效应对策)

2023-04-17 05:22分类：震荡行情阅读：

导读：Uplift模型旨在量化干预（Treatment）对不同人群的差异影响，进而通过人群定向/数值策略的方式对人群进行差异化策略。本次分享主要介绍快手在Uplift 模型上的探索、应用及迭代，以及在业务中使用Uplift 遇到的一些难题和优化解决方案。

分享主要分为以面四部分内容：

介绍
难点
应用
总结

分享嘉宾｜周小羽快手经济学家团队Tech Lead

编辑整理｜王鑫民同济大学

出品平台｜DataFunTalk

介绍

首先简单介绍Uplift。

Uplift 模型要做的就是预估每一个人对实验的反应，从而圈选一部分对实验敏感性较高的人群。举个例子，商家希望通过给客户发美妆折扣券提高客户在商家的消费。当商家对所有用户发美妆产品的折扣券时，男性用户可能无法get到这个折扣券的用处，而女性用户可能会更被这个策略吸引。如果我们计算发折扣券的平均效果——即ATE（average treatment effect）时，如果男性用户无反馈而女性是正反馈，两个群体的实验效果加起来可能是不显著的。

进一步地，我们希望发现激励效果显著的用户群体，业务上比较常见的做法是用户分层，但是传统的用户分层很难展示高维度的分层结果，这也是Uplift流行的原因——我们希望估计高维度的异质性因果效应——HTE (heterogeneous treatment effect)，而并非ATE。

估计HTE的方法有很多，例如casual tree，casual forest等，我们先从线性模型的角度讲解如何从ATE估计到HTE。在实验变量离散的情况下（即传统做法，将用户分为实验组和对照组），ATE的计算公式为两个用户组结果变量diff的期望；在实验变量是连续的情况下（比如实验变量是药剂剂量时），ATE的计算公式就是结果变量对实验变量求导。用散点图说明：当x轴是实验变量、y轴是结果变量时，ATE为各点拟合曲线的斜率。以此类推，HTE需要我们对每个点求斜率。

一个简单的解决方法是构造实验变量和特征变量的交互项并且拟合一个线性函数：对没有交互项的函数，求解的实验效应是常数，即所有人实验效应相同；对于有交互项的函数，求解的实验效应是一个关于特征变量X的函数。对于该种HTE的形式，我们也可以称其为CATE (conditional average treatment effect)，因为它conditional on 了特征变量X。

举例：假设用户的数据包含了性别和年龄这两个画像变量，且均被 one-hot编码——性别等于 1 为男性，性别等于 0 为女性，年龄1为大于 30 岁、0为小于30岁。在这两个维度下，用户可以被分成四个人群，我们希望估计每个人群的异质性因果效应。线性模型求解结果如表中公式所示。该方法的优点在于：

①易于理解：HTE等同于用户分层之后对各群体求ATE。

②可以进行统计检验：通过 delta method 快速计算标准误差。

难点

快手在应用Uplift模型中遇到了如下一些问题。

第一个问题：业务场景下实验变量经常是连续的。当第一单位和第二单位的边际影响不同时，我们应如何捕捉并且量化这个现象？

比如push 消息：我们希望通过 push 让增加用户的 App时长。每天push 一两条一般人可以接受，但是用户收到第五条时，他们会就很厌烦甚至会关掉 push提醒功能，这样平台以后就再也没有拉起该用户的机会了。我们希望有一个不仅能给出HTE、还能计算每个用户在不同实验剂量下的边际效应的模型。这样就可以知道应该给哪些用户多push 几条。

再举个例子：当一个作者粉丝数增加的时候，我们希望他能更多地在平台上进行生产。我们发现作者增加的第一个 1000 单位粉丝和第二个 1000 单位粉丝带来的作品发布数的增量是不一样，因为大 V主播和小主播对同等量级的粉丝增量的体感不同。如何 capture 这个规模效应也是业务经常遇到的问题。

第二个问题：非线性模型如何做统计检验？

线性模型由于假设太强，模型效果经常表现很差。换成更复杂的机器学习模型之后， delta method不再适用于求标准误差。并且特别对于一些波动特别大的指标，即使用delta method效果也不好。因此我们需要知道如何判断指标的显著性。

对于上述两个问题，我们简单地介绍在快手的解决方法。

首先是估计规模效应。以作者和作者生产数为例，经济学中有一个理论叫边际效应递减法则：即作者粉丝数增加时，单纯通过涨粉对于作者生产数产生的激励存在一个上限。如上图所示，我们期望看到增加单位粉丝带来的生产数实际是逐渐递减的。如果能预估该作者的涨粉能力上限和生产数上限，对平台资源的分配是有极大帮助。

一个比较粗暴的解题思路是构建一个函数形式，使HTE为一个关于实验变量的函数。

以之前提到过的线性函数为例（左框中的公式），我们对干预变量和特征变量进行交互，求解得到的HTE是一个关于X的函数。但该形式下第一单位的treatment effect和第二单位的treatment effect是等价，因此并不能达到我们之前预期的边际效益递减的目的。如果我们拟合一个非线性函数，如上图中的多项式函数形式，一阶导后CATE是关于X 和 T的函数形式，这意味着第一单位的 treatment effect 和第二单位的 treatment effect 不等价，CATE随着 treatment的变化而变化的。这种粗暴求解的思路缺点在于：对 CATE的函数形式的假设会非常强。

为了解决上述问题，我们基于Farrell在2020年的论文，构造了神经网络的优化模型，并称其为“双重神经网络”模型。input layer由特征变量构成 (如用户画像)，经过第一个神经网络的feature hidden layer构建交互特征；interaction layer包括关于特征变量的函数a(X)以及函数和treatment的交互项b(X)，经过parameter hidden layer进行交互得到非线性关系，最后output layer输出得到HTE。

我们在这里展示某个真实的业务分析中双重神经网络模型的表现。该分析中，我们首先用双重机器学习模型对估计目标进行纠偏（实验变量并非纯随机试验，而双重机器学习模型可以帮助我们生成类随机实验）。同时我们也对量化模型表现进行了优化，生成了基于连续实验变量的uplift curve。上图可以看出双重神经网络模型的表现远远优于其余模型。

此外我们也解决了关于非线性模型如何做统计检验的问题。在得到HTE之后，常常还需要回答：①哪些人HTE是显著的？②模型有多个treatment，各自HTE差异很小，哪个treatment更好更科学？

基于Victor的论文，我们使用data splitting的方法近似significance level：通过不停地对数据进行拆分，main sample用于模型训练，auxiliary sample用于预测HTE，求得HTE的empirical distribution。

该方法用关键的三个指标来衡量HTE的表现：

BLP（best linear predictors of the effects on machine learning proxies）

越靠近0说明估计的HTE等于噪音，越大说明异质性越强。另外，该指标越靠近1说明选择的ML估计方法能对CATE有较好的预测。

GATES（average effects sorted by impact groups）

近似估计HTE是否显著：将每次预测的HTE排序分段，并检验每段的均值是否显著。

CLAN（average characteristics of most and least impacted units）

估计X对HTE的影响是否显著，是一种衡量feature importance的方法。

应用

下面介绍一个基于双重神经网络的Uplift模型在快手的应用。

1. 应用—：涨粉和生产

平台希望圈一些作者，并了解他们生产数的最大空间--知道作者的生产数空间可以便于业务request相应活动流量和预算。我们通过优化的模型可以实现对每一个作者估算一个边际效益曲线。模型也可以做到按照作者类型去分类，得到各类作者生成力的边际。除了估计预算，通过预测每个作者的生产力天花板，运营同学可以针对大V作者做相应的策略调整。模型结果如上右图所示：基于过去一段时间的勤劳程度和其他特征，作者1涨粉到4.5万就不再可能通过涨粉增加收益、而作者2涨粉到1.7万就到头了。

2. 应用二：push消息

平台规定每个用户每天最多可以收到 10 条 push ，第一条 push 对用户的 app 时长影响和第二条 push 的影响肯定是不同的：从逻辑上来说，第二条 push 带来的影响会弱一点。如何用模型去 capture 这个影响？通过双重神经网络的模型，我们可以对每一个设备预测它在不同 push 条数下的反应。

结果如上图所示，我们从所有的样本中选择 7 个设备，并且画出了收益衰减图：横坐标是设备收到的push数量，纵坐标是模型预测的边际效益。蓝线代表该随机抽取的设备当被 push 第一条消息HTE就已经到 0，因此该设备并不适合做push策略；粉线代表另外一个随机抽取的设备被push第7条消息时HTE仍然没有到0，因此可以多push一些消息。

总结

DNN+HTE可以应用在探索收益天花板的问题中：

①帮助业务规划资源。比如想申请一部分预算助推给作者分发助推流量，DNN+HTE模型可以帮助探索收益的天花板，预估合理的预算申请金额。

②帮助调整定价策略。比如给商家进行涨粉，应该在什么地方多收钱，什么地方少收钱，可以探索公域和私域的收益天花板，通过这两个天花板去调价。

post analysis让结果更稳健：

①对DML可以跨模型比较模型表现，适合复杂的模型结构。

②可以探索一个模型估计的HTE的variation是否够大；variation比较小的时候可能圈人效果不准。

③可以探究特征变量对HTE的影响是否显著，帮助业务缩小决策圈，只对显著的人群做策略。

问答环节

Q1：是基于离线数据的分析吗？

A1：是离线数据分析。但不是基于实验AB实验的结果：关于涨粉和生产两个案例，我们直接用大盘数据训练，并用模型进行纠偏。

Q2：应用中研究的Uplift 模型中，什么情况下 meta learner 间接建模会比 casual tree 直接建模对 Uplift 效果更好？

A2：meta learner 在离线分析中的使用可能较少，多使用于线上分析，因为它最大的优点是速度快，在线训练模型可能有一定优势。但是缺点是它不灵活，大部分 meta learner 只能对离散的实验变量去做建模。我们在对连续实验变量建模时，做了大量 research ，最后设计了一种可以拉通比较离散实验变量和连续实验变量模型的表现的方法，从而使得我们在模型选择上更加灵活。

Q3：模型是怎么评估的，如何判定模型是否准确？

A3：将数据分为训练集和测试集，在测试集上拟合，使用root mean square error评定模型表现。

Q4：如何选择混淆因素，实际发现X选择对 DML 影响很大，如何判断结果的置信度？

A4：使用非实验数据的情况下，对X一般建议应选尽选。在双重机器学习模型的应用中，我们会对Model Y 和 Model T 的残差去做检验，看其是否显著相关，且它们的均值是否有显著区别。因为这是 DML 的假设，如果连这个基本的假设都不能满足，那必然是有一个比较大的混淆因素被 left over ，需要重新再去筛查。

今天的分享就到这里，谢谢大家。

01/分享嘉宾

周小羽｜快手经济学家团队 Tech Lead

2018-2021年在SAS Institute担任统计软件开发，主要负责研发面板数据相关的功能(PROC PANEL, PROC CPANEL, etc)。2020年加入快手经济学家团队并担任Tech Lead，负责研发迭代快手自研因果分析工具，探索学术界前沿因果分析方法。

02/关于我们

DataFun：专注于大数据、人工智能技术应用的分享与交流。发起于2017年，在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会，已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章800+，百万+阅读，14万+精准粉丝。

文/福布斯中国

11月11日24点，一年一度的双11画上了第14个句号。与往年相比，今年的双11开局低调，结局平淡。猫狗没有办晚会，没有以秒为单位刷新的数据，“双十一”词条更是处在微博热搜榜低位。舞台上的平台、商家、消费者黯然。即使这场购物狂欢已谢幕3天，依然有人在追问：双11变了，我们还需不需要这样一个和普通促销日越来越像的全民购物节？

“没有GMV，不用再等了。”一位接近天猫的内部人士在11月11日23时向福布斯中国透露。

不同于曾经两大平台的隔空打擂，今年天猫京东双方均未公布GMV，而是低调笼统表述双11战绩：“稳中向好”“再创佳绩”。走过GMV疯狂增长的岁月，在流量和销量中、增量和存量里，平台和商家变化了思路——舍前者，取后者。这不仅是基于当下经济形势，在不确定中寻找确定性的新选择，也是电商行至今日必然的返璞归真。

“双11不止是一次活动，更是能量的场……所以我们把每年双11都看作是系列感的、有延续的一个整体。”三顿半创始人兼CEO吴骏在2022天猫双11全球狂欢季上的发言，从商家的角度揭开了双11乃至电商行业的变化趋势。

消费行为被描述为能量场域，一定程度上证明了这是一个有关长期的故事。在整个互联网红利见顶的大环境下，多元商家，多平台混战，用户增量空间趋近天花板，商业进入存量竞争时代，已成为行业共识，需要更新战略与理念。

今年早些时候，淘宝天猫产业发展及运营中心总裁吹雪曾公开表示，今年双11最重要的是两个方面，一是消费者体验，二是商家的用户增长。而这正好与淘宝天猫“从交易走向消费”战略的核心举措一一对应——往前，做深消费决策内容，往后，做好售后、物流和履约。

过去，新媒体语言、新达人种草、新主播安利以及新疫情的环境让消费行为变得情绪化。滤镜褪去后，理性客观占据上风，曾经的新消费正逐渐过渡到价值消费。但只有“价”是不够的，还要不断提升“值”——性价比、实用度、增值服务和情绪价值。

以增值为交付目标，以增效实现可持续增长，为用户提供更全面的服务和更好的体验，逐渐成为行业的共识。流量带来的增速是短暂的，对电商们来说，实质竞争最后都会走到供应链竞争上。考验的是其后端供应链、产品品质、履约服务的实力。这是一场从线上回归实体的竞赛，也是平台和商家真正需要静心沉淀、打磨内功的“能量”。

走过14年，双11的“边际效应”递减，GMV失效后，也许双11在未来会变成一个普通的促销活动，但它蕴藏的启示却是长久的。当我们重新审视今年的双11，会发现这是一场从高速增长到高质量发展的转变。消费行为不会只在双11这一天爆发，而是作为能量持续弥散，为平台和商家提供长期主义视野的经营理念和经营哲学——增长，不一定留存数字变化，而在蓄势中厚积薄发。

在刚刚过去的618中，有一个直播间火爆全网，它就是新东方旗下的东方甄选。由于其独特的双语直播模式、主播深厚的知识积累以及诙谐幽默的讲解方式，在短短一个星期内便圈粉无数，直播间粉丝数已经突破千万，在线上平台更是掀起了一股“新东方热潮”。这一切，得益于直播数据的爆炸式增长，新东方在线的股价也呈现直线飙升的趋势。从资本市场来看，人们似乎认为新东方已经实现了新的突破。但当前这一切，还要从那场改变整个教培行业的双减政策说起。

对于以英语教培起家的新东方来说，去年落地实施的“双减”政策无疑是晴天霹雳。包括新东方等在内的众多教育培训机构受到剧烈冲击，营收和股价应声下落。在此背景下，新东方不得不选择断臂求生，走上了直播带货的转型道路。

2021年12月28日，一个名为“东方甄选”的抖音直播间悄然上线，俞敏洪带领团队开启了首次直播带货。作为一家以教授英语起家的培训机构，新东方在转行直播后，发展出了一套独特的直播方式，那便是利用自己的英语特长进行双语直播。和以往主播嘈杂的宣传和大喊上链接不同，新东方的直播则是一支马克笔和一个小白板，仿佛回到了久违的学校课堂。同时区别于其他主播的奋力推销，当你打开东方甄选的直播间时，仿佛置身于一场免费的线上公开课，与其说是直播带货，更像是在课堂的间隙展示一下“实物教具”。这种新颖的带货模式宛若一股清流，吸引了大批粉丝支持。

红火的背后，却是“翻车”难控

6月20日，“东方甄选被投诉桃子霉烂长毛”登上微博热搜。有消费者对媒体表示，在东方甄选下单的陕西水蜜桃约有四分之一霉烂长毛。尽管商家很快全额退款，但消费者仍存有疑虑：这是如何“甄选”的？

这并非东方甄选首次被爆出品控问题。此前也曾有消费者反映过“馒头带毛发”、“油杏重量不达标”、“大虾产品收到时冰已融化”等一系列质量问题。虽然直播间均迅速做出反应，并及时进行了妥善的售后处理，但频繁出现产品质量问题仍然会给消费者带来不好的印象。

农产品带货“翻车”不仅仅是“东方甄选”的问题，在生鲜直播红火的背后，充斥着大量品质“翻车”事故。纵观往昔，罗永浩也曾多次出现带货产品品质“翻车”的情况，特别是在2020年5月20日，由罗永浩直播带货的“花点时间”鲜花遭遇大量用户投诉，称其收到的鲜花存在发蔫或腐烂等质量问题。事故发生后，罗永浩宣布将向消费者退还全部款项，并额外按原价支付用户赔偿金。

作为直播带货头部流量的李佳琦，也被多次投诉“牛奶变质”“蛋糕到货品质不一致”“牛肉丸超期”等诸多质量问题。无论是在头部流量直播间，还是在商家店铺，生鲜产品的“翻车”事故仍然频发不断。虽然直播带货进一步推动了农产品上行通路的打造，但是此类“翻车”问题的持续发生，将对于国内生鲜农产品产业的发展造成以下三点损害：

01、社会大众健康风险不断提升

生鲜农产品多以食品为主，其主要为食用性产品。部分产品发生品质变化后，在外观、味道等方面难以察觉，而实际食用后可能会对于人体造成较大伤害。因此在此过程中，由于生鲜农产品品质难以保障，将进一步加大社会大众食用变质食品的风险，从而对于人体造成持续性的伤害。

02、生鲜农产品损耗情况难以缓解

国内目前生鲜农产品损耗情况相对于发达国家来说，仍处于较高水平。近年来，国家层面也在持续关注完善生鲜农产品供应链体系、降低生鲜农产品损耗等相关问题。生鲜农产品直播带货的火爆，进一步推动了农产品出山难、滞销以及农民增收等问题的解决。但是由于供应链体系的不健全，也将进一步加剧国内生鲜农产品的损耗问题。

03、供应链相关资源的无效占用和浪费

发运不符合标准的产品，势必会对于供应链全链条的资源造成无效占用和浪费。生鲜农产品多数需要利用冷链资源来完成全过程的仓储、运输等操作，在此过程中，需要投入较高的管理和运营成本。若是已经发生变质或是不符合质量要求的产品正常进行发运，其所经历和占用的所有资源，均是无效使用，最终造成全社会有限资源的浪费。

究其原委，农产品直播带货的再思考

值得注意的是，东方甄选直播带货的主要品类是以食品为主的生鲜农产品。与传统的工业品、食品直播带货不同，农产品线上销售存在三大难点：

第一，农产品属于非标品，品质不好控制；

第二，生鲜农产品物流难度高，难以实现长期保存，运输时间长就易产生损坏；

第三，产品利润率低，一般毛利率不超过10%-15%。

在这种情况下，并不具备对货源、物流渠道完全把控能力的线上主播出现“翻车”现象也在意料之中。

对于带货农产品的难点，新东方在线CEO孙东旭也曾表示，出于农产品非标准化、物流难度大、品控困难等挑战，新东方在线对供应商的要求很严苛，会优先选择与好评多、品质顶尖的商家合作。选品方面，东方甄选要求所有产品必须有相应的质检报告，且通过匿名购买，检查供应商的样品与实际商品是否相同。但是即使如此，在面对链路复杂、环节诸多、主体多样的生鲜农产品供应链（详见示意图）下，各类产品的品质仍然难以得到完全的把控，“翻车”问题仍会持续存在。

图生鲜产品供应链流程图

纵观生鲜农产品供应链结构，我们不难看出以下四点核心问题：

其一，现有主流供应链构成方式难以支撑产品品质保障需求

以本次事故为例，由于东方甄选在货源、物流等方面品控能力不足，因此该水蜜桃供应链属于典型的分布式决策情形。所谓分布式决策情形是指：供应链中，供应商和零售商双方基于各自的利益展开博弈行为，以实现自身成本收益的最优。而集中式决策过程的目标是使得包括供应商、零售商、消费者等在内的供应链各方整体利益最优。由于分散式决策下双重边际效应的存在，供应商和零售商可能会投入更少的保鲜努力水平，最终出现产品的质量问题。

其二，产地（品牌）直发的双刃剑

在农产品直播带货火热的当下，类似于“东方甄选”的主播带货团队，大部分采用的都是“签约代售、产地（品牌）直发”模式。在此情况下，主播团队可以在前端选品时，对于产品及厂家的资质进行查验。但在实际运营过程中，易出现产地（品牌）实际发运产品与前期审核产品之间存在差异的情况。产地（品牌）直发模式对于生鲜农产品直播带货销售来说是一把双刃剑，一方面产地（品牌）直发可以减少中间的中转环节，提高物流效率；但同时另一方面，也容易造成主播团队对于实际发运的产品品质和流通过程难以把控，最终造成“翻车”事故。

其三，包含冷链物流在内的供应商选择及考核标准不完善

生鲜农产品对于生产加工以及流通环节的操作要求较高，且各个环节均需处于符合标准的情况下，才可真正意义上保证产品品质。因此，在供应商管理的过程中，对于各类供应商主体还应该建立完善的选择和过程考核标准。即在选拔合适的供应商的同时，对于供应商实际过程中的操作进行监控，及时替换不符合规范的供应商，确保全供应链处于可控状态，保证产品最终交付品质。若标准出现缺失，引入不合规的供应商，势必会造成供应链的失控。

其四，打造透明供应链迫在眉睫

基于生鲜农产品供应链全程的高标准操作要求，建立透明化、可追溯的供应链体系迫在眉睫。提高生鲜农产品品质，保障食用食品安全，需要有透明供应链的支撑。在现阶段，能够实现全程透明可视的企业还属于少数，多数情况下，还是处于“盲盒”状态下进行产品流转，这也进一步增加了产品“翻车”的风险。

“冷链”，生鲜农产品品质保障的利器

生鲜农产品具有新鲜度随时间推移而逐渐消逝的特性，因此在流通渠道中的保鲜能够使得生鲜农产品在线上零售时有更高的新鲜度，可以吸引消费者增加购买机率。

而冷链物流为所需运输、仓储及流通加工的货品，提供最为适宜的温度和湿度环境。抑制了细菌的活性，降低细菌在此过程中的繁殖量，尽可能的保证货品的品质。

图食物的危险温度区

低温环境对于绝大多数细菌数量的增长有着明显的遏制效果，在货品流通的过程中，冷链物流能够尽可能的保证这些食品、生鲜、药品等不受到细菌的侵害，为货品的品质和安全提供保障，延长生鲜农产品的储存期限。

“一骑红尘妃子笑，无人知是荔枝来”，冷链物流在我国出现最早可追溯到唐代，但是国内系统性发展集中在近十余年的时间当中，自2008年奥运会后，国内冷链物流进入到系统性、跨步式发展阶段。

冷链物流是助力巩固脱贫攻坚成果和实现消费升级的重要动力之一。

一方面，伴随着国家陆续出台支持冷链物流发展的相关政策, 包括冷藏车、冷库在内的冷链物流基础设施得到完善,冷链产业成为健全城乡双向流通体系、推动乡村振兴和共同富裕的重要抓手。通过发展冷链物流实现农民增收和保障“菜篮子”安全。

另一方面，冷链物流在消费升级方面发挥着不可忽视的作用。随着我国居民消费水平的不断提高，进口冷链食品成为新的风口。此外，新冠肺炎疫情给电商冷链供应链带来的巨大影响不容小觑。它不仅让更多的消费者包括过去从来不碰网购的老年消费者，加入到了生鲜食材网购大军，并为未来更为广泛的餐饮食材供应链的形成，打下了坚实的基础。

伴随着消费者对生鲜消费需求的持续旺盛，冷链物流得到了飞速发展。自2010年起，我国冷链物流市场需求开始逐步扩大，冷链物流总体呈现健康、快速、稳定的发展态势，基础设施规模进一步增加，设施建设更趋理性，冷链物流体系不断完善，行业发展模式日趋多元化。十年间，我国食品冷链物流需求总量增幅超过了300%。但是，冷链物流“断链”、“伪冷链”等问题突出，与此相关的产品质量安全隐患仍然较多，市场规范化水平有待进一步提升。

“不经一番寒彻骨，怎得梅花扑鼻香”

一、“东方甄选”真不简单——筹备打造自营供应链

新东方在线曾表示，目前东方甄选主品牌定位是销售农产品和图书，并未拓展到其他品类，但商品的品牌及数量的确在大幅增加。孙东旭也曾多次公开表示，会坚持农产品主赛道不动摇。

由于农产品是非标品，种类丰富，在选品上需耗费大量精力，东方甄选正在尝试自建供应链，未来将大力发展东方甄选自营产品。目前，东方甄选只有三四个自有产品，团队将按照每月5-6款产品的速度推出自营产品。

新东方在线还称，会将客户在意、复购率高的产品做成自营产品，让自营产品的研发、生产、制造、物流、交付、客服等环节更加稳定、可控。另外，也已引入大量供应链、运营和自营产品等领域的专业人士。

同时，6月15日，新东方教育科技集团董事长、总裁俞敏洪赴中农联农展中心考察调研。过程中俞敏洪表示，希望未来与中农联等涉农头部企业合作，从助农公益、技术、渠道等多领域为切入点，共同为国家农业发展大势做出贡献。

二、行业观察

回归行业发展，助力生鲜农产品供应链体系的建设除企业自建供应链体系外，行业建设还可重点从以下四方面入手：

01、完善农产品产地（品牌）认证体系建设

在现阶段，通过从国家角度设立地标农产品，进一步对于农产品的商品化建设进行了完善，农产品品质也在一定程度上得到了提升。但是对于供应链运行过程而言，目前暂未有统一的监管机制对于各类农产品实际发货品质进行评估，这也造成了生鲜农产品选品查验过程品质良好，而实际发运质量不过关的问题。因此，建议未来进一步完善农产品产地（品牌）认证体系，对于相关农产品发运，乃至供应链全过程环节进行评估，全方面提升认证产地（品牌）的农产品质量。

02、深化主播团队与产地（品牌）合作

加强主播团队与供销社等农产品供销系统的合作，建立畅通的农产品供应网络。针对信用较好的生产商，可以提供资金支持、产地免检入库等优惠。同时选择销量高、需求大的特定农产品优先进入供应链体系，通过类似订单农业、农产品自营等形式加强产地端把控能力。

03、建立健全企业信用体系

目前，对于企业信用体系的评估主要集中于财务及官司诉讼等情况，暂未涉及企业实际业务运行等相关信息。建议健全企业信用体系，将业务运行相关情况及客户反馈信息，纳入企业信用评价标准。通过信用体系，全面评估企业经营与管理水平，让行业上下游可以更加全面的对于该企业实际情况进行判断。避免出现合作后，由于企业经营水平不达标而造成的业务损失。

04、打造冷链物流全程追溯平台

《“十四五”冷链物流发展规划》中曾提出，到2025年建成覆盖冷链产品重点品类、流通全链条、内外贸一体化的全国冷链食品追溯管理平台。该平台的建立，将进一步推动生鲜农产品透明供应链的建设。从国家的角度，实现冷链货品的可追和可查，增强冷链货品的安全和品质保障。

综上所述，“东方甄选”仅是新东方转型之路的一个起点，深入农产品产业建设，助力农产品供应链打造，才是新东方未来发展的核心方向之一。相信不久的将来，“东方甄选”给我们带来的将不仅仅是农产品好物，期待着那抹深耕农业的“东方”寒梅香！

文章来源：中物联冷链委

小源笔记（一百零三）：精读复刻论文《属性关联的双极容度多属性决策 VIKOR方法》步骤4（4）.mp311:04

来自LearningYard学苑

分享兴趣，传播快乐，增长见闻，留下美好。

亲爱的您，

这里是LearningYard学苑！

今天小编给大家带来期刊论文精读，

欢迎您的用心访问！

本期推文阅读时长大约6分钟，请您耐心阅读。

Share interest, spread happiness, increase knowledge, and leave beautiful.

Dear you,

this is the LearningYard Academy!

Today, the editor brings you intensive reading of journal papers,

welcome your visit!

This tweet usually takes about 6 minutes to read. Please be patient and read.

今天小编将从思维导图、精读内容、知识补充三个板块为大家带来论文《属性关联的双极容度多属性决策 VIKOR方法》步骤四，接下来我们开始今天的学习吧！

Today, the editor will bring you the calculation and analysis of the paper "VIKOR Method of Bipolar Tolerance Multi-attribute Decision Making of Attribute Association" from the three parts of mind map, intensive reading content and knowledge supplement. Next, let's start today's study!

思维导图

本节内容思维导图如下所示：

A mind map of the contents of this section is shown below.

精读内容

在论文的第四个步骤中，作者提到采用AHP方法来确定各个属性的shapley值，本期推文针对合作博弈贡献中更公平分配利益权重的算法——Shapley值方法进行深入学习。

In the fourth step of the paper, the author mentioned the use of AHP method to determine the Shapley value of each attribute. This article focuses on the Shapley value method, an algorithm for more equitable distribution of benefits in the contribution of cooperative game.

首先，Shapley值法是Shapley L.S于1953年提出，为解决多个局中人在合作过程中因利益分配而产生矛盾的问题，属于合作博弈领域；应用Shapley值的一大优势是按照成员对联盟的边际贡献率将利益进行分配，即成员i所分得的利益等于该成员为他所参与联盟创造的边际利益的平均值。

First of all, Shapley value method was put forward by Shapley L.S in 1953. It belongs to the field of cooperative game to solve the problem of conflicts caused by the distribution of interests among multiple players in the process of cooperation; One advantage of applying Shapley value is to distribute benefits according to the marginal contribution rate of members to the alliance, that is, the benefits shared by member i are equal to the average value of the marginal benefits created by the member for the alliance he participates in.

其次，关于Shapley值的符号定义如下所示：

（1）n、N：假设合作博弈系统内有n个成员，由N={1, 2, …, n}表示；

（2）S：不同成员组成不同的联盟，记为S，S是N的子集；

（3）v(S)：定义在N上的一实函数v为特征函数，即联盟S的收益记为v(S)；特征函数v(S)具有超可加性，若联盟A和B没有交集，则A与B构成新联盟的利益大于等于联盟A与B的收益之和，即当A，B符合A∩B=ϕ条件时：v(A∪B)≥v(A)+v(B)；

（4）φ_i(v)：表示联盟中成员i获得的利益。

Secondly, the symbol definition of Shapley value is as follows:

(1) N, N: Assume that there are n members in the cooperative game system, represented by N={1, 2,..., n};

(2) S: Different members form different alliances, marked as S, S is a subset of N;

(3) V (S): a real function v defined on N is the characteristic function, that is, the revenue of alliance S is recorded as v (S); The characteristic function v (S) is super-additive. If alliance A and B do not intersect, the benefits of the new alliance formed by A and B are greater than or equal to the sum of the benefits of alliance A and B, that is, when A and B meet the requirements of A} B= ϕ Under the condition: v (A ＋ B) ≥ v (A)+v (B);

(4)φ_I(v): refers to the benefits obtained by member i of the alliance.

最后，关于shapley值法存在一些性质和公理，Shapley值分配策略是满足以下四个公理的唯一解。

（1）对称性

设Π是N={1,2,…,n}的一个排列，对于N的任意子集S={i_1,i_2,…,i_m}，有ΠS={Πi_1,Πi_2,…,Πi_m}。若在定义特征函数w(S)=v(ΠS)，则对于每个成员i属于N都有φ_i(w)=φ_Πi(v)，这表明了利益相关者的先后顺序或者记号标记并不会对利益分配结果造成影响。

（2）有效性

∑iϵN(φ_i(v))=v(N)，这表明利益相关者联盟的总价值就是各Shapley值之和，即特征函数值。

（3）冗员性

若对于包含成员i的所有子集S都有v(S{i})=v(S)，则φ_i(v)=0。其中S{i}为集合S去掉元素i后的集合；这说明如果一个成员对于任何他参与的合作联盟都没有贡献，则他不应当从全体合作中获利。

（4）加法性

若在N上有两个特征函数v, w，则有φ(v+w)=φ(v)+φ(w)，这表明有多种合作时，每种合作的利益分配方式与其他合作结果无关，总分配是两项的和。

Finally, there are some properties and axioms about the Shapley value method. The Shapley value allocation strategy is the only solution that satisfies the following four axioms.

(1) Symmetry

set up Π Is an arrangement of N={1,2,..., n}. For any subset of N S={i_1, i_2,..., i_m}, there is Π S={ Π i_ 1, Π i_ 2,…, Π i_ m}。 If the characteristic function w (S)=v is defined（ Π S) For each member i belongs to N φ_ i(w)= φ_Π I (v), which indicates that the sequence or marking of stakeholders will not affect the result of benefit distribution.

(2) Effectiveness

∑i ϵ N( φ_ I (v)=v (N), which indicates that the total value of the stakeholder alliance is the sum of the Shapley values, that is, the characteristic function value.

(3) Redundancy

If there is v (S {i})=v (S) for all subsets S containing member i, then φ_ i(v)=0。 Where S {i} is the set after removing element i from set S; This shows that if a member has no contribution to any cooperative alliance he participates in, he should not benefit from the whole cooperation.

(4) Additive

If there are two characteristic functions v, w on N, then there are φ (v+w)= φ (v)+ φ (w) This shows that when there are many kinds of cooperation, the benefit distribution mode of each cooperation has nothing to do with other cooperation results, and the total distribution is the sum of the two.

接下来，就是关于shapley值的公式推导，在日常生活中，我们都接触过这样一个现象，那就是1+1不等于2；这里小编想说的是，很多时候多个主体分别产生的影响和共同产生的影响是不具备严格加性的。有句俗语，一个和尚挑水吃，两个和尚抬水吃，三个和尚没水吃；分开的三个和尚每个每天都挑水，但放在一起“协作”反而就没有水产出了，这里是一个关于协作的负面例子，但更多的是协作的正面例子，就是1+1大于2的效应。以下用一个案例具体来说明。

Next, we will deduce the formula of shapley value. In our daily life, we have been exposed to the phenomenon that 1+1 is not equal to 2; What the editor wants to say here is that in many cases, the impact of multiple subjects separately and jointly is not strictly additive. There is a saying that one monk carries water to eat, two monks carry water to eat, and three monks have no water to eat; Each of the three separate monks carries water every day, but when put together, "cooperation" will not produce water. Here is a negative example of cooperation, but more positive examples of cooperation, that is, the effect of 1+1 is greater than 2. Here is a case to illustrate.

某公司有三个员工，分别是A，B，C，如果大家不合作，A每个季度可以完成3个项目，B每个季度可以完成10个项目，C每个季度只能完成1个项目。但是老板小王为了充分挖掘员工潜力，合理配置公司资源，让A，B，C尝试了各种合作模式。王老板观察发现，A都是潜力股，C都是催化剂：A和B合作每个季度可以完成15个项目，合作效果还行；A和C合作每个季度可以完成50个项目，合作效果爆炸；B和C合作每个季度仅完成了12个项目，合作效果一般；ABC一起合作每个季度可以完成70个项目。最终王老板拍板让ABC以后就一起工作，按照小组完成的项目数额外发放项目奖金。请问按照最公平正义的分配方法，哪位员工获得的奖金是最多的呢？

A company has three employees, A, B and C. If you don't cooperate, A can complete three projects every quarter, B can complete 10 projects every quarter, and C can only complete one project every quarter. However, in order to fully tap the potential of employees and reasonably allocate the company's resources, the boss, Xiao Wang, let A, B and C try various cooperation modes. Boss Wang observed that both A and C are potential stocks and catalysts: A and B can complete 15 projects each quarter through cooperation, and the cooperation effect is good; A and C cooperation can complete 50 projects every quarter, and the cooperation effect is explosive; The cooperation between B and C has only completed 12 projects each quarter, and the cooperation effect is average; ABC can work together to complete 70 projects each quarter. Finally, Boss Wang agreed that ABC would work together in the future and pay project bonus in addition to the amount of projects completed by the team. According to the most fair and just distribution method, which employee gets the most bonus?

说A的同学：明显A是潜力股，虽然单独工作表现一般，但是和C一起合作，大大激发了工作热情，肯定是A贡献最多！

Classmate who said A: It is obvious that A is a potential stock. Although the performance of individual work is average, working with C has greatly stimulated the enthusiasm for work. It must be A who contributes the most!

说B的同学：应该是B贡献最大，因为单独来看，B本身能力是最强的！

Classmate who said B: B should make the greatest contribution, because B itself is the strongest!

说C的同学：应该是C贡献最大，虽然C单独工作没什么效率，但显然对团队的影响无法替代！

Classmate who said C: C should make the greatest contribution. Although C is not efficient in working alone, it obviously has an irreplaceable impact on the team!

请先别急，我们接下来使用理性的数学思维分析这个问题，可以顺便推导出shapley值的公式。设想我们按顺序将ABC放到合作队伍中（合作队伍一开始为空），那么合作的组合会有3!=6种，如下表：

Please don't worry. Let's use rational mathematical thinking to analyze this problem. We can deduce the formula of shapley value by the way. Imagine that we put ABC into the cooperation team in order (the cooperation team is empty at the beginning), and the combination of cooperation will be 3= 6 types, as shown in the table below:

在上表B+C+A的顺序组合中，A的贡献是ABC的合作扣除BC的合作，即70-12=58；B的贡献就是B加入空的贡献，即10-0=10。其他类推。但最终的加入顺序只有一种，而各个顺序都是等可能的。

In the sequence combination of B+C+A in the above table, A's contribution is ABC's cooperation minus BC's cooperation, that is, 70-12=58; B's contribution is that B adds null contribution, that is, 10-0=10. Other analogies. However, there is only one final order, and each order is equally possible.

因此，A的贡献可以计算期望：(3+3+5+58+49+58)/6=176/6；B的贡献可以计算期望：(12+20+10+10+20+11)/6=83/6；C的贡献可以计算期望：(55+47+55+2+1+1)/6=161/6。

Therefore, A's contribution can be calculated as expected: (3+3+5+58+49+58)/6=176/6; B's contribution can be calculated as expected: (12+20+10+10+20+11)/6=83/6; C's contribution can be calculated as expected: (55+47+55+2+1+1)/6=161/6.

这些贡献期望加在一起，(176+83+161)/6=70也恰是ABC的整体合作效果，验证了我们计算的合理性。做个简单除法，得出最终A的贡献占比是29.33%，B的贡献占比是13.83%，C的贡献占比是26.83%。A的贡献是最多的，C也很多，B最少。

Taken together, these contributions and expectations (176+83+161)/6=70 are exactly the overall cooperation effect of ABC, which verifies the rationality of our calculation. Make a simple division and find that the final contribution of A is 29.33%, that of B is 13.83%, and that of C is 26.83%. A contributed the most, C contributed a lot, and B contributed the least.

我们接下来把问题抽象化。成员i在参与S联盟时有(|S|-1)!种排序，|S|表示联盟S所包含的成员数，而剩余(n-|S|)个成员的排序有(n-|S|)!种，所有成员i参与的不同的排序组合除以n个成员的随机排序组合就是成员i对于联盟整体所应分得利益得权重，记为[(|S|-1)!(n-|S|)!]/(n!)。成员i参与不同联盟S为自身参与联盟创造得边际贡献记为[v(S)-v(S\{i})]，那么成员i从总体利益v(N)所分得的利益为：

Let's abstract the problem. Member i has (| S | - 1) when participating in S alliance! | S | indicates the number of members in the alliance S, while the remaining (n | S |) members are sorted by (n | S |)! The different sorting combinations that all members i participate in divided by the random sorting combinations of n members is the weight that member i should share in the interests of the alliance as a whole, which is recorded as [(| S | - 1)! (n | S |)!]/(n!). The marginal contribution created by member i participating in different alliances S for his own participation in the alliance is recorded as [v (S) - v (S {i})], then the benefit shared by member i from the overall benefit v (N) is:

注意：S\{i}表示从集合S中删除元素i后的集合。

Note: S {i} represents the set after deleting the element i from the set S.

知识补充

接下来我们继续来对Shapley Value公式进行通俗解释，以及关于Shapley Value是否可以做预测，接下来和小编一起来了解一下吧！

Next, let's continue to explain the Shapley Value formula in a popular way, and whether Shapley Value can be predicted. Next, let's have a look with Xiaobian!

如上所述，Shapley Value是累加贡献的均值，但枚举所有序列可能性的方式效率不高，注意到累加贡献的计算实际为集合相减，对于同样的集合计算次数过多是效率低下的原因。公式中S表示序列中位于Xi 前面的元素集合，进而N\S\{Xi}表示的是位于Xi后面的元素集合，而满足只有S集合中的元素位于Xi之前的序列总共有∣S∣!(∣N∣−∣S∣−1)!个，其内序列中产生的Xi累加贡献都是v(S⋃{Xi} )−v(S)；最后对所有序列求和之后再取均值。

As mentioned above, Shapley Value is the mean value of cumulative contribution, but the method of enumerating all sequence possibilities is not efficient. It is noted that the calculation of cumulative contribution is actually the subtraction of sets. Too many calculations for the same set are the cause of inefficiency. In the formula, S represents the set of elements in front of Xi in the sequence, and N S {Xi} represents the set of elements behind Xi, while only the elements in the S set are before Xi, and the total number of sequences in front of Xi is ∣S∣! (∣N∣−∣S∣−1)! The cumulative contribution of Xi generated in its internal sequence is v (S ⋃ {Xi}) − v (S); Finally, sum all the sequences and then take the mean value.

关于Shapley Value是否可以做预测，因为Shapley Value本质上是对最终全集产生的收益做分配的问题，所以首先预测问题求解过程中就需要满足有效性的限制：

As for whether Shapley Value can make predictions, because Shapley Value is essentially a problem of allocating the income generated by the final complete set, it is necessary to meet the effectiveness constraints in the process of solving the prediction problem first:

这就已经难以保证优解；其次考虑合作必然产生收益的特殊情况：（v ( S ′ ) ≥ v ( S ) iff. S ⊆ S ′ ），则必有：

It is difficult to guarantee the optimal solution; Secondly, consider the special situation that cooperation will inevitably generate benefits: (v (S ′) ≥ v (S) if. S ⊆ S ′), then there must be:

即所有的预测都是高于实际值的；最后，求取Shapley Value的过程中需要用到所有子集的收益值，使用Shapley Value实际上不是做预测，而是做压缩。

That is, all forecasts are higher than the actual value; Finally, we need to use the income value of all subsets in the process of obtaining Shapley Value. Using Shapley Value is not actually a prediction, but a compression.

今天的分享就到这里了。

如果您对今天的文章有独特的想法，

欢迎给我们留言，

让我们相约明天，

祝您今天过得开心快乐！

That's it for today's sharing.

If you have a unique idea about today’s article,

welcome to leave us a message,

let us meet tomorrow,

I wish you a nice day today!

参考资料：DeepL翻译、百度百科、哔哩哔哩

参考文献：

[1]林萍萍,李登峰,江彬倩,余高锋,韦安鹏.属性关联的双极容度多属性决策VIKOR方法[J].系统工程理论与实践,2021,41(08):2147-2156.

本文由LearningYard学苑原创，如有侵权请在后台留言！

文案 |Yuan

排版 |Yuan

审核 |Qian

https://www.suoduoma.com

上一篇：电信产业园(最新一轮电信重组)

下一篇：股票行情(冠福股票吧)

股票学习网