从数据中获取业务价值需要准确、全面且无偏见的数据。拥有一个具有不同人口分布、教育和专业背景的人组成的多元化团队可以帮助公司有效实现这一目标。当他们从事数据和分析工作时,他们需要平衡“以技术为中心”的方法还是“以人为本”的方法。
图源:GETTY IMAGES(盖蒂图片社,Getty Images,1995年成立于美国西雅图,作为全球数字媒体的缔造者首创并引领了独特的在线授权模式——在线提供数字媒体管理工具以及创意类图片、编辑类图片、影视素材和音乐产品。)
随着企业努力实现数据驱动,以及最近人工智能技术的爆发,对机器训练数据的需求不断增加,数据的质量变得越来越重要。在data pipelines(数据管道,是一种允许数据通过数据分析过程从一个位置高效流向另一个位置的软件。这就好比一条传送带,它能高效、准确地将数据传送到流程的每一步。)和其他技术方面的数据质量方面,如数据的一致性、有效性、及时性和可用性,都投入了大量的时间和金钱。
但是数据质量的一个方面同样重要,而且经常被忽视,而支持技术可以解决的问题——即完整性。
解决这个问题的最好方法是在性别、种族、年龄、国家背景、教育、商业专业知识等方面建立一个尽可能多元化的数据团队。
一、数据驱动的公司表现出色
在过去的几年里,许多研究表明,做出基于数据决策的公司赚得更多。例如,IDC(International Data Corporation,国际数据公司,是国际数据集团旗下全资子公司。是信息技术、电信行业和消费科技市场咨询、顾问和活动服务专业提供商。经常发布的市场资讯、预测和资深分析师关于业内热点话题的观点性文章。)对600多家公司进行的一项调查显示,成熟的数据实践可以令收入提高了三倍,近乎三倍可能性地缩短新产品和服务上市时间,两倍可能性提高客户满意度、利润和运营效率。
《Harvard Business Review/哈佛商业评论》和Google Cloud(谷歌云,为谷歌推出的云服务器平台,云服务器的出现原是为了减少小公司或者个人在配置硬件上的潜在成本。)在3月份对商业领袖进行的一项调查显示,数据和人工智能领袖在运营效率、收入、客户忠诚度和保留率、员工满意度和IT成本可预测性方面显著优于其他公司。
高管们正在关注此事。Salesforce(创建于1999年3月的一家客户关系管理/CRM 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台)今年春天发布的一项针对近10000名企业高管的全球调查显示,80%的人表示数据对其组织的决策至关重要,73%的人表示数据有助于减少不确定性并提高准确性。
二、多元化有利于业务发展
进一步的研究表明,多元化也能带来更好的业务绩效,多元化的团队更具创新性,能做出更好的决策,并有更高的保留率。而且,大多数公司现在都明白了多元化和包容性的价值。
在PwC(PricewaterhouseCoopers Consulting,普华永道咨询公司,国际领先的管理咨询公司之一。2002年7月30日,普华永道咨询公司被IBM以35亿美元的现金和股票形式收购。)今年2月发布的一份报告中,85%的全球公司将多元化、公平性和包容性作为其既定价值或优先事项。其中,46%的人这样做是为了吸引和留住人才,20%是为了取得业务成果,13%是为了提高声誉,11%则是为了遵守监管要求。
但很少有公司能够实现他们的多元化目标,数据科学是这方面最糟糕的行业之一。
根据Zippia(是一家位于美国加利福尼亚州圣马特奥的在线工具供应商,帮助人们规划自己的职业生涯,为人们提供不同的职业选择对大家未来的职业生活产生什么样影响的工具。)的最新数据,只有20%的美国数据科学家是女性。只有7%是西班牙裔,尽管美国人口的19%都是西班牙裔,只有4%是非洲裔美国人,尽管非洲裔美国人占美国人口的12%。
法律服务公司Clio(于2008年成立,为中小型律师事务所提供云实践管理程序。通过一套基于云的解决方案,提供包括案件管理、客户获取及关系管理在内的软件服务,为律师赋能,使其既能做到以客户为中心,又可以专注于公司业务。在90个国家和地区拥有150,000个客户,与150多个集成合作伙伴共事,并赢得了全球66个律师协会的青睐。被公认为是加拿大发展最快的公司之一,Deloitte Fast 50和Fast 500的上榜企业之一,CIX最具创新技术20强公司之一,法律实践管理软件的唯一领导者。)的决策科学高级主管Nika Kabiri(尼卡·卡比里)说:“如果没有一个多元化的团队,你就不太可能了解不同的生活经历。”
她补充说,仅仅让高管们承诺雇佣不同的团队是不够的。
她说:“他们还需要为不同的声音创造发声空间,让个人以深入了解产品开发的方式愉悦地分享自己的生活经历。否则,高管们只会以肤浅的方式解决偏见,打造低于用户需求的产品。”
Genpact(简柏特,简柏特全球集团是由美国通用电气/GE和另外两家美国投资公司共同出资成立的一家从事业务流程外包/BPO的专业集团公司,它在全球范围内为客户提供高质量的业务和技术服务,通过卓越的实践经验,协助全球客户增加收入,降低成本,提高企业综合竞争力。公司共有员工65,000余人,分布于美国,墨西哥、印度,中国、匈牙利、罗马尼亚的30多家分支机构。)人工智能和机器学习服务副总裁兼全球领导者Sreekanth Menon(斯雷坎思·梅农)表示,随着生成人工智能和large language models/大型语言模型(LLM,是使用深度学习算法处理和理解自然语言的基础机器学习模型。这些模型在大量文本数据上进行训练,以学习语言中的模式和实体关系。LLM可以执行多种类型的语言任务,例如翻译语言、分析情绪、聊天机器人对话等。)的出现,这一点在今天尤为重要。他表示,LLM(大型语言模型)以偏见和幻想而闻名。这很可能是由于训练数据的过于集中。例如,与其他语言相比,这些模型在英语方面做得更好。
他说:“拥有一个来自不同地区的多元化团队可以帮助纠正这种偏见。”同样,种族、性别和其他特征的多元化有助于为数据应用创建更多的道德框架,并带来思想的多样性。
他说,在他自己的团队中,有20到30%的人来自纯数学或统计学背景。其余的则来自其他领域,“我有一个生物信息学背景的员工在为我工作,”他说,“不同的背景会有所裨益。”
Tim Berners-Lee(蒂姆·伯纳斯-李,英国计算机科学家,万维网发明者,2016年度图灵奖得主,英国皇家学会工艺院院士,麻省理工学院计算机科学及人工智能实验室创办主席及高级研究员,网页科学研究倡议会总监,麻省理工学院集体智能中心咨询委员会成员。1990年12月25日,他和罗伯特·卡里奥在CERN一起成功通过Internet实现了HTTP代理与服务器的第一次通讯。)创立的Inrupt公司(是一家美国个人数据存储平台,用户可以把他们的个人数据存储在POD/个人在线数据存储中。这些POD可以与分散的应用程序共同操作,并且可以在用户愿意的时候进行分离。)的数字信任和伦理副总裁Davi Ottenheimer(达维·奥滕海默)表示,人工智能有可能放大数据偏见问题,这可能会导致致命的结果。
例如,他说,早期的图像识别系统会非人道地对黑人面孔进行错误分类,一些人工智能系统会将黑人的手贴上持枪的标签,而不是白人的手,这是因为系统构建团队的多元化不足。
他说:“团队缺乏多样性可能会导致无辜的人被伤害。”
Alison Alvarez(艾莉森·阿尔瓦雷斯)是BlastPoint的联合创始人兼首席执行官,BlastPoint是一家为金融机构和公用事业服务的数据公司,她补充道:“在工程领域,有很多例子表明,缺乏多元化的团队可能会导致糟糕的结果。比如当这些传感器设计出来帮助客人洗手时,他们没能识别出深色皮肤。他们没有一个多元化的团队来构建并进行实际测试。”
但除了性别、种族等,多元化还有更多的维度。Alvarez(阿尔瓦雷斯)认为,多样性可能包括某人的国籍,或者他们是否有过敏或其他健康问题。
多元化甚至可以包括一个人在一个公司中的级别。
她说:“如果你不在较低层次上赋予人们权力,他们的观察结果就会被降级。”
例如,the Challenger space shuttle disaster(挑战者号航天飞机灾难。指挑战者号航天飞机于美国东部时间1986年1月28日上午11时39分/格林尼治标准时间16时39分,发射在美国佛罗里达州的上空。挑战者号航天飞机升空后,因其右侧固体火箭助推器/SRB的O型环密封圈失效,毗邻的外部燃料舱在泄漏出的火焰的高温烧灼下结构失效,使高速飞行中的航天飞机在空气阻力的作用下于发射后的第73秒解体,机上7名宇航员全部罹难。挑战者号的残骸散落在大海中,后来被远程搜救队打捞了上来。)是可以避免的,因为任职的工程师两年来一直在警告密封圈的可靠性,包括在发射前夕。Microsoft(微软,是一家美国跨国科技企业,1975年4月4日创立。公司总部设立在华盛顿州雷德蒙德/Redmond,邻近西雅图,以研发、制造、授权和提供广泛的电脑软件服务业务为主。最为著名和畅销的产品为Windows操作系统和Office系列软件,是全球最大的电脑软件提供商、世界PC/Personal Computer/个人计算机,软件开发的先导。)前副总裁Gavriella Schuster(加夫里拉·舒斯特)说,当只有一个视角在看数据时,人们很容易错过一些事情。如今,她是Women in Cloud(云端女性。策划并参与推动女性科技企业家及其科技解决方案发展的活动。活动重点是为女性领导的企业提供机会,并建立行业专家、思想领袖和顾问社区网络。旨在为女性企业家和专业人士创造 10 亿美元的经济机会,其重点关注创造就业机会、D&I、技术创新和可持续性。)和 Women in Technology(WIT网络是一个非营利组织,提供教育、指导和网络建设,让技术专业人员能够构建并发展自己的事业。)的创始成员,Women Business Collaborative(女性事业协会。美国非营利组织。)的顾问委员会成员,Nerdio(微软云虚拟桌面管理平台)和Microsoft(微软)的董事会成员,以及Berkshire Partners(伯克希尔合伙公司,美国著名私募基金。总部位于美国波士顿,自 1986年创立以来通过旗下 8支私募基金投资的中型公司超过了 110家,总资本承诺达 110亿美元。在消费品、零售、商业服务、工业、通信和交通等多个领域建立了丰富经验。通过与管理公司合作,帮助投资组合公司成长最终取得高投资回报。)的战略顾问。
她说:“很多时候,人们使用数据来验证他们自己的假设,但忽略了那些不能验证这些假设的数据。当你有足够的不同视角看同一组数据时,你往往能够避免这种现象。”
但你在哪里能找到这些眼睛呢?
Schuster(舒斯特)建议公司不仅仅重视那些拥有10年数据科学经验的人。“如果你仅寻找有这种经验水平的人,你往往不会得到多元化的候选人池。”
此外,她说,数据科学正在迅速发生变化,如果团队中缺失可能以不同方式考虑人工智能和数据流程的新人,这可能是一个不利因素。
事实上,你甚至可能不需要数据科学家。
她说:“你真正想要的是在组织信息和思考模式方面有一定经验的人。”拥有生物科学或经济学学位的人可能有正确的思维方式,“在一些继续教育项目中,你可以派人去让他们学习特定技术。”
其他候选人可能来自公司的其他领域,或使用数据科学团队构建的产品的其他部门。他们了解用户需求和业务价值,并需要该领域的专业知识。
她说:“贬低那些没有计算机科学背景或信息系统背景的人确实伤害了很多首席信息官。因为那样你就会错过那些了解业务、行业或垂直领域的人,他们可以看到不同信息。我见过很多次这种情况。”
她还建议有多个不同的候选人可供选择。如果你想雇佣更多的女性,那么至少需要有两名女性进入决赛。
她说:“否则,如果你只有一个人,人们的偏见自然会针对那个人。”
她还建议寻找来自不同地理区域的候选人,为了雇佣多元化的人才,面试小组同样需要多元化。
最后,寻找具有不同背景和不同观点的团队成员的领导者需要超越他们现有的社交网络。
她说:“人们的社交网络中往往会有像他们这样的人。除非你离开你认识的人,否则你不会有多元化的候选人。”
Forrester(弗雷斯特市场咨询,是一家独立的技术和市场研究公司,针对技术给业务和客户所带来的影响提供务实和具有前瞻性的建议。公司已经被公认为思想的领导者和可信赖的咨询商,通过所从事的研究、咨询、市场活动和高层对等交流计划,帮助那些全球性的企业用户建立起市场领导地位。)的分析师Kim Herrington(金·赫林顿)为希望拓宽社交网络的领导者提供了一个建议:在LinkedIn(领英,启动于2003年5月,是一个面向职场的社交平台,总部设于美国加利福尼亚州的森尼韦尔。该公司于2011年5月20日在纽约证券交易所上市。网站的目的是让注册用户维护他们在商业交往中认识并信任的联系人,俗称“人脉”。用户可以邀请他认识的人成为“Connections/关系”圈的人。截至2020年5月,领英的用户总量已经达到6.9亿以上,在中国拥有超过5000万名用户。2014年2月25日,领英简体中文版网站正式上线,并宣布中文名为“领英”。)上,找到五位你需要技术人才的领域的不同专业人士,并关注他们。
她说:“然后挑战自己,尽可能多地再次这样做,作为追随者,直到你的订阅信息源成为一个充满多样化和精彩声音的花园。”
她说,其中一个起点可以是LinkedIn(领英)上的The Algorithmic Justice League(算法正义联盟,是一个推动技术平等的倡议团体,他们鼓励公众提高对人工智能的警觉,并帮助受影响社群发声,同时鼓励技术人员和政策制定者降低人工智能的偏见。)“在‘人物’标签上,你不仅会找到不同背景的人,而且他们也会聪明、热情,并有动力帮助你和你的团队更加关注技术及其陷阱。”
尽管招聘手段和技能短缺成为头条新闻,但她确实听到很多公司抱怨找不到人。
“当我听到这些,我相信你,”她说。“但后来我对你的人际网络、你过高的期望,以及你可能过时的人力资源系统和政策了解了很多。2023年及以后,没有理由不让多元化的人出现在你的规划中。”
Herrington(赫林顿)给首席信息官的首要建议是“把你的衡量标准放在嘴边。”
她说:“这是我对希望改善数据质量的首席信息官和首席数据官的建议。要做到这一点,首席信息官可以与其他数据和分析领导者合作,询问‘我们如何……’,因为这涉及到衡量和沟通数据团队的多元化、留住不同员工、担任数据角色的不同员工数量、候选人多元化人口统计、晋升率、包容性和归属感水平、薪酬水平、领导层的多样性以及员工敬业度水平。”
她说,一种可行的方法是从一个组织已经在收集的数据开始。例如,一个组织可能会为其客户群或其主要服务的地点收集人口统计数据。她说:“然后比较你的EEOC(Equal Employment Opportunity Commission/平等就业机会委员会。1965年7月2日成立的旨在结束就业中的种族歧视的联邦政府机构。)(员工)数据,查看图表结构中的百分比时,哪里部分存在失调。”
三、多元化吸引人才
根据Glassdoor(是美国的一家做企业点评与职位搜索的职场社区。在Glassdoor上可匿名点评公司,包括其工资待遇,职场环境,面试问题等信息。)的《2023 workplace trends repor/t2023年工作场所趋势》报告,74%的美国员工表示,在考虑新工作时,企业在多元化、公平性和包容性方面的投资对他们来说“非常重要”或“有些重要”。年轻人对多元化特别感兴趣,72%的35岁以下的员工表示,如果他们认为管理层不支持多元化举措,他们会考虑拒绝工作邀请或辞职。三分之二的人还会拒绝一家领导层中存在性别和种族失衡的公司的工作。
Gartner(高德纳,Gartner Group公司成立于1979年,它是第一家信息技术研究和分析的公司。它为有需要的技术用户来提供专门的服务。Gartner已经成为了一家独立的咨询公司,Gartner公司的服务主要是迎合中型公司的需要,它希望使自己的业务覆盖到IT行业的所有领域,从而让自己成为每一位用户的一站式信息技术服务公司。)的分析师Jorgen Heizenberg(约根·海森伯格)说:“在我的研究中发现团队的多元化实际上会提高人才吸引力。不同背景的团队更成功,更有创造力,这最终会带来更高的忠诚度。”
四、从以技术为中心转变为以人为本
在数据科学团队中获得不同声音的一个重要好处是,有更多的机会超越纯粹的技术解决方案。
Heizenberg(海森伯格)说:“数据和人工智能都是由具有相同背景、受过相同教育、以技术为中心的方法主导的人组成的。”
这就是为什么数据团队将大部分预算、时间和人员花在诸如数据管理、数据治理和高级分析等技术的原因。
但成功的加速器和预测因素是数据驱动型文化的建立。
“有趣的是,第一件事经常被忽视,他们在治理、工具和技术上花费了太多的时间,”他说,“在很大程度上,这是有同样背景和经验的人的结果,而且变得非常独立。”
根据Gartner(高德纳)的调查,接受变革的文化挑战是成功的第三大障碍,其次是缺乏企业股东的支持,仅次于缺乏员工和资金。
Heizenberg(海森伯格)说:“我告诉客户的是,当他们从事数据和分析工作时,他们需要平衡以技术为中心的方法还是以人为本的方法,并通过建立跨职能和多学科的团队来做到这一点。”
作者:Maria Korolov(玛丽亚·科洛洛夫)