贫民窟的人工智能

2019 年 1 月 22 日 算法与数学之美

26岁的单身母亲Brenda住在非洲最大的贫民窟基贝拉,这也是全球最贫困的社区之一。

每天早上,Brenda从家离开,乘坐公共汽车前往内罗毕东部,和她的1000多名同事一起,在同一栋楼开始一天八小时的工作。

她的主要工作内容是建立训练数据集,将信息尤其是图像处理为一种计算机可以识别的格式:上传图片,然后用鼠标标记几乎所有内容,包括人、车辆、交通标识、道路标记,甚至是天空,尤其是要标记其能见度是晴天还是多云。

每天八小时,Brenda将对用于人工智能的数据进行标注。

这一切将服务于一个他们之前鲜有耳闻的概念——人工智能。从这里输出的数百万个类似的图像将流入人工智能系统中。以自动驾驶为例,这意味着系统可以开始“识别”现实世界中的物体了。而数据量越大,机器就越智能。

但这些技术成果或许永远都不会被基贝拉享受到。作为非洲最大的贫民窟,它有当前更迫切需要解决的问题,例如缺乏可靠的清洁水,以及众所周知的卫生危机。

他们的工作结果将由一位上级进行检查,如未达到标准,则将被退回。对于速度最快,标记最准确的标记师,他们的名字将荣登办公室附近的屏幕上。最受欢迎的奖励则是商场购物券。

为了确保每一个像素都被正确标记,Brenda和她的同事们每天工作时需要离电脑屏幕很近很近。

但没有人抱怨,“每个人都该做点与众不同的事,”Brenda对自己这份工作非常满意,“我相信我的工作将会对未来的人们有所帮助。”

 贫民窟中的人工智能学校 

Brenda所在的公司名叫Samasource。这是一家总部位于旧金山的公司,其客户包括谷歌、微软、Salesforce和雅虎。

大多数公司不愿谈及他们与Samasource合作的具体内容,因为这通常涉及的是公司未来的项目。但众所周知,Samasource 的前期数据整理是这些硅谷巨头在人工智能领域项目的重要组成部分。

Brenda 居住在非洲最大的贫民窟基贝拉中

似乎离这里无比遥远,但人工智能在这里依然带来了积极的影响。

BBC记者采访过程中驱车前往基贝拉的一座历史性建筑物,这座建筑物位于一条铁路线附近。在下雨天,建筑物被泥浆包裹。但自殖民地时期开始以来,它就一直有人在用。

一年多前,这座建筑物还是暴徒和军队之间的分界线。今天,它变成了一个蓬勃发展的活动中心,包括一所媒体学校和媒体工作室,一家自助餐厅。而一楼有一间机房,在这里,Gideon Ngeno向25名学生教授使用个人电脑的基本知识。

令人惊讶的是,即便是在基贝拉这样的地方,数字化程度也很高。智能手机十分普遍,充电器及相关配件也很容易找到,人们还会用MPesa 支付系统进行购买。

图像必须被精心标注,包括车辆,道路,标记。。。甚至是天空

但大部分的非洲地区跳过了个人电脑的时代。鼠标和键盘的组合对他们而言是一种陌生且繁琐的体验。Samasource员工告诉我,当需要查找资料时,公司里的大部分人常常会离开电脑直接拿出手机。

Ngeno教授的这项课程是专为想去Samasource或其他数字经济公司的人设计的。学费需要500肯尼亚先令,约合五美元。对于生活在贫困线以下的人来说这也不是一笔小数目。公司曾尝试免费授课,但没有了经济压力,出勤率和学员们的集中度都不尽如人意。

Ngeno说,最大的挑战其实是噪音。在我们讲课的同时,一群熊孩子正在窗外拿着乐器玩耍。教室外就是一个喧闹的市场。

 “非洲硅谷” 

相比之下,Samasource的位于内罗毕的办公室是这里城市化水平最高的地方。公司占据了商业园区其中一座建筑的四层楼,拥有大量用于数据处理培训的计算机。

SAMASOURE图像标注。这些数据讲帮助自动系统“识别”现实世界中的物体

如果你不看窗外的景色,你可能会认为你正置身于硅谷的一家科技公司。覆盖着瓦楞铁的墙壁在加州被认为是一种“后工业化风”,在这里却是一种标记,提醒着人们约75%的员工都来自贫民窟。

最令人印象深刻的是,Samasource克服了大多数硅谷公司正在努力解决的问题——性别歧视。

在这里,超过一半的劳动力由女性组成,结婚并不会阻碍女性的事业发展。长达90天的产假以及轮班模式的灵活性使该公司成为肯尼亚乃至全球范围内公司文化有包容性的典范。

负责管理人力资源的Hellen Savala说: “我们相信,如果公司有一名男性,他就能养活他的小家庭,但如果公司有一名女性,她不仅能养活她的小家庭,她还能担负起我们的大家庭。因此你会产生更大的影响力。”

 廉价劳动力 

Samasource公司数据产品的准确性和安全性是Google等大客户与他们合作的原因。但显然,这些公司倾向于在劳动力成本低下的地区雇佣劳力,当地人也迫切需要稳定的工作。

Samasource的目标雇佣人群是那些目前单日收入在2美元以下或从事危险的非正规工作的人。Samasource提供每天约9美元的工资。这对当地人的生活将会是一个巨大的改进,尽管对硅谷来说这些钱却微不足道。

Gideon Ngeno 在基贝拉的核心地带教授基本的数字技术

“是的,它具有成本效益,”Janah说。“但在我们的工作中至关重要的一件事是使我们支付的工资额度不会扭曲当地劳动力市场。如果我们向人们支付的金额远大于此,我们就会把物价整体抬高。这会对当地的社区住房和食物成本产生负面影响。

当然,还有一个更为重大的问题是这项工作的持续性。毕竟Samasource的主要业务是为自动化过程提供数据。如果创建数据的过程也变得自动化,公司将何去何从?

“大多数人都认为这是花十亿美元就可以解决的技术问题,”Janah说。

“我认为目前这只是炒作,如果你真的与数据科学家交谈这些算法背后的思想,你会发现机器比大多数人认为的要落后许多。

“市场将在很长时间内仍需要人工训练数据集。”

“它改变了我的一切”

成为一名数据标记师是一项无聊、重复且无休无止的工作。避开摄像机镜头时,一些工作人员会愿意聊聊他们如何减少休息时间,以应对工作压力达到公司目标。 Samasource的部分员工是不限工作地点的自由职业者,但在工作时间会有网络摄像头对他们的工作进行监管。

Idris Abdi搬出了贫民窟,并计划参与商业领导力课程

经我们观察,办公室内几乎没有人体工程学的设备来为工作人员服务。长时间的蹲伏、点击都将对视力和身体造成一定伤害。该公司已表示将对此采取改善措施。

Samasource相信它已经对发展中国家近5万人产生了积极影响;那些人要么在Samasource工作,要么得到过Samasource员工的支持。Samasource调查了他的前雇员,发现其中约84%的人找到了更正式的工作或接受了高等教育。

25岁的Idris Abdi是其中一员,他也因此搬出了贫民窟。

他说,“Samasource改变了我的一切,它改变了我的眼界,让我看到除了生活在这片土地之外新的希望。”

相关报道:https://www.bbc.com/news/technology-46055595

END

∑编辑 | Gemini

来源 | 36氪·大数据文摘




更多精彩:

☞  哈尔莫斯:怎样做数学研究

☞  扎克伯格2017年哈佛大学毕业演讲

☞  线性代数在组合数学中的应用

☞  你见过真的菲利普曲线吗?

☞  支持向量机(SVM)的故事是这样子的

☞  深度神经网络中的数学,对你来说会不会太难?

☞  编程需要知道多少数学知识?

☞  陈省身——什么是几何学

☞  模式识别研究的回顾与展望

☞  曲面论

☞  自然底数e的意义是什么?

☞  如何向5岁小孩解释什么是支持向量机(SVM)?

☞  华裔天才数学家陶哲轩自述

☞  代数,分析,几何与拓扑,现代数学的三大方法论





算法数学之美微信公众号欢迎赐稿

稿件涉及数学、物理、算法、计算机、编程等相关领域,经采用我们将奉上稿酬。

投稿邮箱:math_alg@163.com

登录查看更多
0

相关内容

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。
专知会员服务
125+阅读 · 2020年3月26日
IBM《人工智能白皮书》(2019版),12页PDF,IBM编
专知会员服务
21+阅读 · 2019年11月8日
人工智能顶刊TPAMI2019最新《多模态机器学习综述》
专知会员服务
95+阅读 · 2019年10月18日
Gartner 报告:人工智能的现状与未来
InfoQ
14+阅读 · 2019年11月29日
已删除
将门创投
3+阅读 · 2019年1月8日
人工智能背后的“人工”
i黑马
5+阅读 · 2018年10月14日
人工智能与机器学习技术在医疗保健行业中的应用
深度学习与NLP
11+阅读 · 2018年3月25日
关注人工智能:人工智能+ 金融添双翼
专知
5+阅读 · 2018年2月5日
李开复为何说年底人工智能泡沫要破?
数据猿
4+阅读 · 2018年2月5日
人工智能的阴暗面
计算机与网络安全
6+阅读 · 2018年1月8日
【人工智能】人工智能在深度学习领域的前世今生
产业智能官
5+阅读 · 2017年11月24日
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
AutoML: A Survey of the State-of-the-Art
Arxiv
70+阅读 · 2019年8月14日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
4+阅读 · 2018年4月29日
Arxiv
5+阅读 · 2017年10月27日
VIP会员
相关资讯
Gartner 报告:人工智能的现状与未来
InfoQ
14+阅读 · 2019年11月29日
已删除
将门创投
3+阅读 · 2019年1月8日
人工智能背后的“人工”
i黑马
5+阅读 · 2018年10月14日
人工智能与机器学习技术在医疗保健行业中的应用
深度学习与NLP
11+阅读 · 2018年3月25日
关注人工智能:人工智能+ 金融添双翼
专知
5+阅读 · 2018年2月5日
李开复为何说年底人工智能泡沫要破?
数据猿
4+阅读 · 2018年2月5日
人工智能的阴暗面
计算机与网络安全
6+阅读 · 2018年1月8日
【人工智能】人工智能在深度学习领域的前世今生
产业智能官
5+阅读 · 2017年11月24日
相关论文
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
AutoML: A Survey of the State-of-the-Art
Arxiv
70+阅读 · 2019年8月14日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
4+阅读 · 2018年4月29日
Arxiv
5+阅读 · 2017年10月27日
Top
微信扫码咨询专知VIP会员