新闻资讯

衡量弹性社区:分析和预测工具

介绍
建筑环境的配置在塑造个人如何与城市空间互动和利用城市空间方面发挥着关键作用。城市社区根据其社区和城市资源的存在、位置和配置对事件做出反应。如果发生不利情况,例如突然发生的地震或洪水,或者气候变化等更为渐进的现象,社区会在其城市空间的物理元素内部和周围适应、承受并繁荣发展。这项研究基于这样的假设:城市形态和社区复原力之间存在显着的相关性。
城市复原力可以对城市环境的运作方式产生重大影响。在连接密集的城市环境中,城市结构之间存在高度依赖性,事件、信号和材料将很容易在这些结构之间传输。密集连接的城市环境将在理想的事件下无缝运行。然而,不良事件也会通过密集连接的城市环境传播,并可能对城市结构造成损害。在这种情况下,如果某些城市结构发生持久损坏,可能需要更长的时间才能恢复。然而,如果城市环境连接稀疏,则期望事件和不良事件都不会传播很远,并且可能需要更短的时间来响应不良事件。因此,
然而,城市复原力的衡量标准和规模似乎多种多样。这使得设计师很难有效地接受和使用这些不同的措施。我们应该使用哪些措施,这些措施对城市韧性设计有什么作用,以及我们如何理解这些措施尺度的含义?我们在本文中解决了这些问题,并提出了克服这些限制的弹性措施。
我们研究的最终目标是建立一种可靠的方法来计算基于城市形态的城市社区的复原力估计。具体来说,我们致力于利用采用对象检测模型的卫星图像来促进对全球任何城市地区的弹性进行自动和一致的评估。我们的长期战略是通过使用每个城市地区的可靠的弹性值列表进行训练,使我们的模型能够直接从图像中对弹性值进行分类。在这项研究中,我们通过使用对象检测来识别卫星图像中的相关城市类型并直接在网络应用程序上评估弹性值,展示了实现这一策略的第一步。我们开发了该工具的第一个原型,称为 RECOMM(测量弹性社区)。深度神经网络(特别是卷积神经网络)可以在多大程度上帮助设计者定量评估城市地区的复原力水平并提出如何改进的建议?
在本文中,我们介绍了 RECOMM 工具、支撑该工具的技术以及我们进行的大量测试,以评估第一个原型的准确程度,并与其他方法相比产生有用的结果。
现有工作
这项研究有助于利用深度学习进行物体检测方法和遥感的应用。在过去的几十年里,这一领域得到了广泛的研究,并取得了重大进展(最全面的调查中的参考文献1 - 3 )。一般的挑战包括需要大型数据集来提高预测的准确性,以及遥感中小物体的检测,正如参考文献也指出的那样。1这项研究并没有受到后者的太大影响,但我们在限制中加入了一个关于提高模型准确性所需的更大数据集的观点。
机器学习 (ML) 和人工智能 (AI) 方法已被广泛且成功地用于模拟新配置并探索可能的设计解决方案(例如参考文献)。4 - 6然而,迄今为止,此类方法尚未广泛用作城市分析和评估的定量工具,特别是在净零排放和复原力设计方面。一方面,我们有许多非常重要的研究,这些研究扩展了机器学习和人工智能方法的知识和使用,以增强设计方法(参见参考文献7 - 9等)。
另一方面,越来越多的研究利用机器学习和人工智能来改善建筑物的控制、管理和设计。Ohene 及其同事10最近对应用于净零排放建筑设计的定量方法进行了全面审查。他们指出深度学习、11残差神经网络 (RNN)、12人工神经网络 (ANN) 13和遗传算法 (GA) 14是应用于净零建筑设计的新兴技术(参考文献7,第 13 页)。
迄今为止,利用计算工具解决城市规模的净零设计和弹性社区的工作仍然很少,特别是在评估弹性的定量方法方面。我们最近开始调查可能的模型,以解决城市复原力的定量方法,探索现有工作并强调可能的前进方向。在参考文献中。15,我们检查了复原力框架,并确定了与其模糊性和整体性相关的一个关键问题。因此,研究人员试图将这个概念分解为多个类别和子类别16 , 17以促进更细致的理解。在我们的调查中,我们确定了有助于恢复力的四个主要类别,即社会环境、经济环境、自然环境和管理。根据研究的性质,可能会为每个类别分配不同的平衡,有些研究侧重于特定类别的影响。鉴于我们调查的空间重点,我们专门检查了物理环境。
主要类别的细分取决于所选的研究方法。在我们之前的研究中,12我们采用了利用 GIS 数据的定量方法来评估净零社区的恢复力。在物理环境类别中,我们确定了三个子类别:交通、教育和休闲。我们的分析表明,与这些子类别的接近程度与社区的复原力得分较高有关,这一点得到了我们的研究结果的支持。
在本研究开始时,我们决定利用特定的数据源(例如在线航空照片)来重新制定物理环境的细分。由于这些数据的性质,我们无法再使用以前的子类别,因为它们依赖于 GIS 信息进行基于位置的评估(例如地铁站、公交车站)。因此,我们选择根据社区和城市地区的布局来评估其弹性,特别强调基于自然的解决方案。研究表明,此类解决方案对保护社区和增强城市地区的复原力具有积极影响。18此外,我们之前的研究15强调了火车站和体育场馆(交通和休闲类别的一部分)等大型基础设施在塑造城市布局和影响复原力方面的重要性。因此,我们在物理环境中建立了四个不同的子类别:绿地、建筑物、大型基础设施和自然元素。
在这项研究中,我们提出了额外的发现,其中我们使用我们的方法创建了一个在线工具,可以根据任何社区或城市区域的布局自动评估其弹性。
方法
我们创建了两组卫星图像。第一个基于 DeepGlobe 土地覆盖分类数据集19,用于使用 Tensorflow 训练模型。我们从原始集中的 803 张图像中选取了 100 张图像作为样本,根据观察到的不同类型选择最具代表性的图像。第二个数据集是专门为此项目创建的,使用 QGIS 从 OpenStreetMap 获取与物理环境相关的特征,这些特征因其本质而无法在航空图像中看到,类似于我们之前的研究。15第二个数据集用于验证模型。
工作流程
对于弹性预测模型,我们遵循以下工作流程:
数据集
1. 从 DeepGlobe 土地覆盖分类数据集中收集卫星图像
2. 使用 VoTT 进行对象标记
3.导出标记图像(JSON)(VoTT-JSON)
4. 将标记数据(JSON)导入roboflow
5. 在roboflow中对图像进行预处理(包括调整大小和增强)
6. [在 roboflow 中] 生成一个新的数据集(带有预处理的图像)并创建训练/测试分割 (70/20/10%)
7. 将新数据集导出为 YOLO5/PyTorch 格式以进行训练。
训练
1.将roboflow中预处理后的数据集导入到Colab中
2. 在 Colab 上克隆 Yolov5
3. 定义模型配置和架构
4. 训练自定义 Yolov5 检测器(大约 4 小时——使用在 GPU 上运行的 CUDA 张量类型)
5. 评估自定义 YOLOv5 检测器性能
6. 使用训练权重进行推理
7.为tensorflow.js导出权重(具有最佳权重模型)
Web 应用程序可视化工具
1.从Colab导入tensorflow.js权重
2. 将模型应用到用户选择的屏幕卫星图像上
3. 计算每个识别的簇与屏幕中心 GPS 位置之间的距离
4. 显示最终的弹性分数
数据准备和标记
初始数据集中的所有卫星图像都具有统一的高度和分辨率,随后使用 Microsoft VoTT:视觉对象标记工具进行单独标记。2 20 VoTT 是“一种用于图像和视频资产的开源注释和标记工具”。VoTT 是一个 React + Redux Web 应用程序,用 TypeScript 编写。20
我们之前对哥本哈根市的研究15表明,根据物理元素的接近度和密度计算的弹性值主要受到绿地、自然元素和娱乐场所的影响。根据这些发现,我们重点关注下面列出的四种视觉上可识别的类型,以便确定与我们的培训相关的类别:
• 绿地
• 建筑物(已建成面积与未建成面积)
• 大型基础设施(火车站、体育场等)
• 自然元素(湖泊、河流、海岸等)
利用 VoTT 进行标记生成了一个带有清晰标记图像的数据集,其中所有图像都被分配到 4 个预定类别,如图1所示。

图1。使用 VoTT 的手动标记流程。
VoTT 允许以各种格式导出标记图像,包括 JSON、CSV、CNTK、VOC 和 Tensorflow Records。经过一些测试,我们选择了 VoTT JSON 格式,因为它提供了与 Roboflow 兼容的清晰数据结构。
然后将标记的图像导入 Roboflow,这是一种在线软件,可以对计算机视觉数据集进行预处理。21
所有图像和标签都经过预处理,包括将所有图像大小调整为 416 × 416 像素,以确保训练的一致性。我们通过应用水平翻转、旋转(−15° 至 +15°)、饱和度(−50% 至 +50%)和曝光(−25% 至 +25%)将图像数量增加到 559 个。数据集分为 70% 为训练集(489 张图像)、20% 为验证集(46 张图像)和 10% 为测试集(24 张图像)。
为训练准备的数据集以 YOLOv5 格式导出,因为该架构可以使用张量和 GPU,使其适合 TensorFlow图 2

图2 . 可视化物体检测器的性能。在这列训练中经过大约 40 个 epoch 后,类别损失曲线下降到 0.033 的值。
张量流训练数据
支持该实验的主要思想是使用 YOLOv5 检测器,这是一种基于 DenseNet/CNN 主干的对象检测模型,并使用推理训练模型的权重。You Only Look Once (YOLO) 模型由 Redmond 等人于 2015 年开发。22并从此引起了计算机视觉领域研究人员的极大关注。YOLO被定义为“一种将图像划分为网格系统的目标检测算法”。网格中的每个单元负责检测其自身内的物体。23 YOLO 架构的优点之一是它能够“计算图像的所有特征并同时对所有对象进行预测”。这就是“你只看一次。” 24自构思以来,YOLO 架构已发展到 V5 (YOLOV5),并经过许多人的研究和测试,包括参考文献 1。25 - 29仅举几例。
YOLO的不同版本由不同的研究人员开发,每个版本都提出了不同的特征。30和参考号。31例如,利用 YOLOV4,Bochkovskiy 和同事演示了如何通过运行图形处理单元 (GPU) 来提高 DenseNets 上的卷积神经网络 (CNN) 的性能32 33使“每个人都可以使用 1080 Ti 或 2080 TiGPU 来训练超快速且准确的物体检测器'(32,第 1 页)。
34 YOLOV5由 Glenn Jocher 于 2020 年在 GitHub 上发布,被介绍为“在 COCO 数据集上预训练的一系列对象检测架构和模型”,代表了 Ultralytics 对未来视觉 AI 方法的开源研究,融合了经验教训和发展的最佳实践超过数千小时的研发”。34
YOLOV5 目标检测模型基于 DenseNet 架构(参见 EfficientDet 架构,该架构采用“ EfficientNet 作为主干网络,BiFPN(双向特征金字塔网络)作为特征网络,以及共享类/框预测网络”(参考文献. 35,第 5 页)。
Jung 和 Choi 36证明,YoloV5 的更新版本优于以前具有类似架构的目标检测模型(例如 YOLOV3 和 YOLOV4),尤其是在城市环境等复杂环境中。
对于我们模型的训练(图2),遵循以下方法:
1. 安装依赖项,包括TORCH.CUDA。该软件包增加了对 CUDA 张量类型的支持,这些类型实现与 CPU 张量相同的功能,但它们利用 GPU 进行计算。36
2.从roboflow服务器导入标记数据集
3. 定义模型配置和架构
4. 训练自定义 Yolov5 检测器
该模型经历了 50 个 epoch 的训练,网络包含 283 层、7,263,185 个参数、7,263,185 个参数、7,263,185 个梯度、16.8 GFLOP(千兆次浮点运算,或每秒浮点运算)。
5. 评估自定义 YOLOv5 检测器性能
6. 使用标签可视化训练数据
图 3显示了地面实况训练数据,其中分类器最初使用训练集进行了测试。分类器准确地分配了各个类别,其中 0 代表绿地,1 代表建筑物,2 代表大型基础设施,3 代表自然元素。
7. 使用训练权重进行推理

图3 . 使用地面实况训练数据进行图像识别的初始阶段。
该方法的最后一步涉及使用在训练期间获得的最佳权重,使用 detector.py 方法对新数据集进行推理。在本例中,我们使用测试集来初步评估 Colab 中的模型。随后,我们采用最佳权重来估计输入模型的任何新地图的弹性值。如图 4所示,该模型成功检测到测试图像中的建筑物。

图4 . 测试“建筑物”类的识别。
在网络应用程序上可视化结果
我们使用 Web 应用程序确定 R 值,该应用程序计算用户选择的地图中心与 Yolov5 模型识别的矩形选区中心之间的距离(以像素为单位)。Web应用程序的前端是使用React.js开发的,而Tensorflow.js用于促进Yolov5模型的加载和在线执行。
它为用户提供了类似谷歌地图的界面,使他们能够探索世界卫星地图、放大和缩小以及搜索特定位置。用户通过单击右下角的按钮来触发分类过程。屏幕中央的 GPS 位置的卫星图像是从 Google 地图中获取的,并由 Yolov5 模型进行编码和处理。输出是每个类别的已识别标记的像素坐标,例如绿地、建筑物、基础设施和自然元素。
这些坐标被转换回 GPS 位置,以便在地图上绘制正方形并计算每个点与屏幕中心之间的视线距离。随后利用这些距离和每个类别的伽玛值来计算弹性值R,然后将结果值显示在屏幕上。对于这个初始原型,没有考虑每个已识别标记的模型不确定性,但可能会在未来的迭代中予以考虑。图5
模型验证
为了评估我们模型的精度,我们对通过两种不同方法获得的 15 个城市的弹性值进行了比较。第一种方法涉及使用现有文献和排名中的数据。第二种方法涉及使用我们在之前的研究中开发的方法来评估弹性值。15然后,我们比较了这两种方法的结果,以确定我们模型的准确性。
根据现有文献对城市复原力进行排名
鉴于复原力的整体性15以及研究人员在研究这一概念时采用的不同方法,16 , 17必须交叉参考不同的方法,以便更全面地理解该主题并确定我们自己方法的有效性。为此,我们研究了两个最详尽的排名,即 2013 年 Grosvenor 报告37和 Numbeo 的生活质量全球排名38根据前者确定 50 个最具复原力的城市,并将其与后者进行交叉引用。与我们的方法相比,这两个排名都采用了非常独特的方法。格罗夫纳报告根据社会凝聚力、环境风险、基础设施和治理等多项因素,对全球 50 个最具复原力的城市进行了排名。数据来源于一系列权威来源,包括政府统计、学术研究和调查。另一方面,Numbeo生活质量指数通过评估多个因素来评估全球城市的生活质量,包括安全、医疗、生活成本、房价、交通、污染、气候等指标。该指数根据贡献者的看法从全球在线调查中收集数据。在这两个指数中,这些因素根据其对复原力的重要性进行评分和加权。虽然格罗夫纳承认城市的活力,但它提供了 2013 年情况的快照。另一方面,Numbeo 生活质量指数会定期调整权重,以考虑调查答复和全球趋势的变化。
我们从 2013 年格罗夫纳报告37中选出了 50 个最具复原力的城市,并将它们与 Numbeo 的生活质量全球排名进行交叉引用。38通过比较两个榜单,我们从生活质量 (QOL) 排名的前、中、后三个城市中选出了 15 个城市。复原力和生活质量指数之间的关系基于 Tapsuwan 等人的工作,39他们将宜居性和生活质量的概念与城市发展背景下的可持续生活和复原力联系起来。
宜居性被定义为“一个地方支持生活质量、健康和福祉的程度”(40、41 )。因此,宜居的社区或城市应该是和平、安全、社会凝聚力和包容性、和谐、有吸引力、负担得起、便利性高、环境可持续且交通便利(40)。高度宜居社区的一个例子是,这里有各种各样的住房,价格实惠,公共交通便利,提供步行和骑自行车基础设施,可以轻松到达学校、就业、公共开放空间、商店、卫生设施、社区和社会服务 ( 40 )。所有这些品质都有助于提高人们的生活质量、健康和福祉。

其中,邻里的整体复原力值 (R) 是通过考虑从邻里中心到特定城市类型(例如学校、公园)的最小距离 d ( min ) 来确定的,ϒ 是评估邻里社区质量的系数。该距离基于 Kronberg 等人、42政府科学办公室、43 Knupfer 等人的研究。44和全国旅行调查。45该系数考虑了私人交通与公共交通的比率以及教育环境中的交通条件等因素。
ϒ值按下表计算:
此方法涉及使用城市特征(例如学校、火车站和公园)的地理位置。我们使用 QGIS 为每个城市生成地图,导入与城市规模的物理环境相关的 OpenStreetMap 特征,并固定 Google 地球图像。为了确定所研究的四种类型(绿地、建筑物、大型结构和自然元素)中每种类型的值,我们使用 Grasshopper 脚本执行公式 ( 1 ) 中所述的计算。该脚本使用了 OpenStreetMap 和 QGIS 创建的地图,并提供了表 3第一列中所示的结果。值得注意的是,方程 ( 1)涉及 OpenStreetMap 中的教育建筑、交通设施和娱乐场所的类别,而我们的计算机视觉工具特别关注绿地、一般建筑和大型基础设施。

连接性分析
为了评估我们的工具相对于更成熟的方法的表现,我们计算了通过香农熵表示的弹性值。香农熵是由数学家克劳德·香农 (Claude Shannon) 于 20 世纪 40 年代在其开创性论文“通信的数学理论”中引入的,46主要针对当时的电信领域。然而,除了电信问题之外,香农熵还被用来分析城市网络和连接的性能。47
在这项工作中,我们将香农熵应用于特定的城市环境。我们使用哥本哈根作为测试案例,并使用 OpenStreetMap 的数据识别所有教育建筑,如“物理元素的弹性”部分所示。然后,我们在每个教育设施周围生成了一个 1.260 公里的方形图块(根据表 4),并评估了图块内的所有交通元素,包括公交车站、有轨电车和火车站,如下图 9所示。

首先,根据教育建筑和每个交通实体之间各自的地理坐标计算这些实体之间的距离 d(i)(表 5,第 2 列)。教育实体和每个交通实体之间的连接概率计算为最大距离 p(i) = 1—day(i)/dmax(i) 的倒数,因为我们更有可能选择较近而不是较远的交通点,假设它们都能带我们去我们想去的地方(表 5,第 3 列)。由于表 5第 3 列中这些概率的总和大于 1,因此通过将初始概率 p(i) 除以它们的总和来对概率进行归一化。这些归一化概率如表 5所示,第 4 列,它们的总和为 1。随后,将这些概率乘以它们的自然对数(表 5,第 5 列),并将它们的总和除以最大熵(表 5,第 6 列),以获得香农熵见表5第(7)栏。
从该表中可以看出,两个图块之间的香农熵H不同,表明第一个图块 ( H = 0.920) 比第二个图块 ( H = 0.760) 功能更好。香农熵越高,表明信息传输越好,信息存储越低;香农熵越低,表明信息传输越低,信息存储越高。
由于瓦片N具有较高的香农熵,我们参考瓦片N +1计算其冗余/备用容量和恢复潜力。这些指标只能参考相对差异来计算,表 5显示了基于扬科维奇工作的第 (9) 和 (10) 列的简单计算。42因此,参考图块N +1计算了图块N的弹性潜力,其中备用容量被确定为这两个图块中相同类型实体数量之间的差异。该差异为 Δn = 11–9 = 2,然后将备用容量计算为S = (n min + Δn)/n min= (9 + 2)/9 = 1.222。随后计算弹性潜力:p = 1 – 1/S = 1 – 1/1.222 = 0.182。
如果我们假设正常运行的城市环境的最小实体数量为 n min,则从图块 N 中删除 Δn 个实体(删除公交车站或类似的)会将冗余/备用容量从 1.222 更改为 1,并将弹性潜力从 0.182 更改为 0由此可见,去除Δn后任何单个实体的去除都可能严重影响城市环境的运行,Jankovic 48将其命名为“崩溃边缘”。
我们对所有 530 个图块重复上述过程,计算最小香农熵 H = 0.299 和最大香农熵 H = 0.999。冗余/备用容量范围为 S = 1 至 S = 15.5。弹性潜力范围从最小值p = .33 到最大值p = .94。
我们的 RECOMM 工具评估哥本哈根的整体弹性值 R 为 5.27(请参阅项目存储库中每个城市的数据的完整列表)。我们集中在 Østerbro 中心的第一块瓷砖上进行比较。通过香农熵,我们获得了 0.182 的值(或将其统一到我们的工具中的 1.82),以了解所考虑的图块的潜在弹性。我们针对同一图块的 RECOMM 工具返回值 1.57,如图10所示。


然而,使用我们的 RECOMM 工具计算的弹性值R不能直接与使用香农熵评估的弹性潜力p进行比较。然而,由于这两个值都是社区复原力的指标(一个基于类型的频率和相互距离,另一个基于类型之间的连通性),我们探索了它们之间可能的关系。我们计算了哥本哈根所有图块(530 个图块)的香农熵H、每个图块中的点数、增量n、备用容量和弹性潜力p,如数据集中所示(可在项目存储库中获取)。
我们发现不同块之间的香农熵、备用容量和弹性潜力差异很大。这意味着某些瓷砖比其他瓷砖工作效率更高,这可能会给居民带来质量问题。例如,在市中心使用香农熵最高的瓷砖的人可能居住在香农熵最低的瓷砖中,解决两者之间的差异可能是个人需要经历的日常体验。不同的弹性潜力值表明某些瓷砖可以比其他瓷砖更快地从扰动中恢复。这很重要,因为如果大型传播事件影响城市,例如大规模示威、恐怖袭击或传播公共卫生威胁,它可能会在图块之间引入差异。虽然具有高香农熵和高弹性潜力的图块可能有助于快速事件传播并且可以快速反弹,但具有低香农熵的图块可能不会传播此类事件,并且尽管弹性潜力较低,但它们可能不需要利用该潜力来传播事件。反弹回来。我们通过我们的工具进行的初步测试表明,通过距离计算的弹性之间似乎存在可能的相关性(如方程参考文献 [1 ]以及通过香农熵获得的一些连通性度量。弹性测度、香农熵、冗余/备用容量和弹性潜力之间的关系需要进一步探索,这将是我们持续研究的主题。
统计分析
为了了解使用我们的工具获得的城市韧性值是否与其他集合具有可比性,我们对 Numbeo 集合的中位权重和使用我们的工具计算的值进行了统计分析。我们以188个城市为样本,在R中进行了多项统计检验,评估两种方法弹性值的可比性表6

第一步是通过我们的工具和 Numbeo 检查这两组的分布。使用直方图我们可以看到这两个分布都不正态。
然后我们进行了 Shapiro-Wilk 检验来检查正态性。由于夏皮罗-威尔克正态性检验对样本大小敏感(即样本最常通过正态性检验),我们将此检验的结果与图形(例如箱线图或直方图)结合起来。图11
H 0表示样本分布呈正态。如果检验显着 ( p < .05),则分布为非正态分布(H 0被拒绝)。如果p > .05,则检验不显着,因此分布为正态(接受H 0 )。R 中 Numbeo 集的 Shapiro.test () 方法给出p值 = 0.0,005,414,即 < .05。这意味着数据的分布与正态分布显着不同。我们可以得出结论,Numbeo 数据不是正态分布的,这证实了目视检查的建议。
R 中我们工具集的 Shapiro.test () 方法给出的p值 = 2.184 × 10 −14,即 < .05。这意味着数据的分布与正态分布显着不同。我们可以得出结论,来自我们工具的数据也不是正态分布的。
由于这两个集合都不是正态分布的,并且使用的样本是配对的,因此我们决定继续使用 Wilcoxon 配对文本。通过 Wilcoxon 两样本配对符号秩检验,我们可以验证两组的中值(Numbeo 的值和使用我们的工具计算的值)是否具有可比性。H 0是两个样本的配对差值的总体中位数为0。
我们使用 wilcox.test () 方法对标准化数据计算 R 中的 Wilcoxon 符号秩检验,并获得p值 = .511,该值大于显着性值 alpha = 0.05。我们可以接受零假设,得出两组(Numbeo 和我们的)的中位权重相同的结论。统计分析的结果表明,我们使用我们的工具获得的结果与 Numbeo 的排名相当。
与其他工具的比较
最后,我们将我们的工具与最近开发的其他工具进行比较,以确定我们的方法在多大程度上提供了与当前现有工具不同和新颖的东西。我们回顾了一些为通过应用计算机视觉和机器学习来探索城市分析而开发的工具。戴安娜特等人。49提供了当前可用的最相关评估方法和工具的最新概述。在他们的分析中(第 49 页,第 9、10 页),我们重点介绍了为城市复原力提供定量方法的工具,如表 7所示,并与我们的工具进行了比较。

我们特别想提请注意 Streetscore 和 RECOMM 之间的差异,因为它们都使用图像来评估城市得分。Streetscore 由麻省理工学院媒体实验室于 2014 年开发,通过场景理解算法来预测街景的感知安全性。它的工作原理是利用从 7000 多名参与者的在线调查中获得的培训数据。51这项研究的参与者被要求回答“哪个地方看起来更安全?”的问题。在提供的一对图像之间。这项调查的结果使用 Microsoft Trueskill 算法进行排名:一种“贝叶斯技能评级系统”,“[...]跟踪玩家技能的不确定性,明确建模抽签,可以处理任意数量的竞争实体,并可以从团队结果推断个人技能。通过在模型l' 的因子图表示上传递近似消息来执行推理(参考文献52,第 1 页)。该项目训练中使用的数据集是从人类参与者及其对街道场景的看法中众包的。虽然大量个人对城市认知(例如安全方面)的反馈可以确保良好水平的公正结果,53根据贡献者的背景和地点,结果可能仍然存在一定程度的主观影响拍摄图像的地方。奈克等人。51表明 Streetscore 在分析靠近纽约和波士顿的城市(用于图像样本)时有效,但在亚利桑那州、加利福尼亚州和德克萨斯州等更偏远的地区则不然,这表明该工具可能存在文化和地理偏见(参考文献 1)。51,第 782 页)。相比之下,我们的 RECOMM 工具采用基于空中视点的根本不同的视角,并通过计算机视觉自动识别形状。我们的方法通过减少与人类感知和主观性相关的固有偏见而提供了显着的优势。我们还没有测量我们的工具中可能存在的偏差(如果有的话),但进一步的研究肯定应该包括使用稳健方法进行一些测试(参考文献54 - 56等等)。
限制和后续步骤
在模型的开发过程中,发现了以下局限性:
1. 由于包含大约 500 张图像的小数据集,模型训练受到限制。像 Yolov5 这样的模型每类需要更多图像(大约数千张),但 Yolov5 仍然可以使用小数据集产生准确的结果。23该网络应用程序使用的数据集基于 DigitalGlobe Basemap + Vivid,57与 Google 地图相比,这可能会导致准确性较低。
2. 城市形态由有限数量的类别(4 个,例如绿地和建筑物)来定义。更全面的实验应该包括更多类别,例如区分各种建筑类型(例如学校、博物馆和住宅区)并考虑整合OpenStreetMap数据以提高准确性。
3. 该模型没有考虑每个元素的单独贡献,例如距区域中心的距离或类型的大小。通过纳入这些因素,结果可能会更加准确。此外,该模型还返回不确定性的度量,可以进一步将其纳入 R 值中。
4. 模型结果根据可视化区域的缩放级别而变化,这与训练集中图像的比例和 Web 应用程序中加载的图像的分辨率有关。在未来的迭代中,一旦用户做出选择,该区域的缩放级别将受到限制。
5. 如果不使用 Roboflow 等工具进行预处理和标记,为 Yolov5 创建自定义数据集的过程充满挑战。
6. 在进一步的迭代中,我们可以减少分析区域,以检查这是否会像 Naik 和同事建议的那样用小样本产生更可靠的结果。51
7. 一旦该工具得到进一步开发,我们可以实现一个例程来同时计算多个图像,并将结果扩展到更广泛的区域,即使不是整个城市。
该项目的下一阶段涉及构建带有注释标签的更大数据集,以提高模型的准确性

图 11 . 两组数据分布的历史记录:我们的工具(左)和 Numbeo(右)。
结论
我们开发的模型计算世界上任何城市的弹性值(R )。该应用程序根据城市类型提供总体R 值和平均 R 值细分,按类别组织,如图12所示。这项研究提出了一种评估城市社区复原力水平的新工具,并提出了增强它的方法。

图 12 . 网络屏幕截图,显示整体弹性值 R 和模型检测到的四个建筑物群。每个簇对 R (0.31, 0.28, 0.26) 的贡献是根据区域中心到每个簇的距离计算的。
使用我们的工具获得的结果在数量级上与根据文献(生活质量和 Numbeo)的现有排名以及使用我们之前的方法使用公式1计算的值一致,如“比较”部分所述并总结于表中参见图4和图8。
通过香农熵对连通性的分析表明,可能与我们的工具计算的弹性存在一些有趣的联系,如“连通性分析”部分所述。这是我们方法未来发展和研究的一个有趣的方向。
最后,统计分析部分表明,由于使用 Numbeo 的数据和我们的工具计算出的值样本的中位权重相同,因此我们的 MERCOMM 工具产生的结果与 Numbeo 的排名相当。
我们进行了多次测试和评估,以确保我们的工具产生的结果与其他既定的城市韧性排名方法相一致。我们的工具具有可应用于世界上任何城市的优势,因为计算基于城市形态以及通过计算机可视化检测城市元素和形式。该工具可用于分析当前弹性排名中未包含的城市,并允许设计师测试设计计划。当前总体规划与拟议规划的弹性水平的比较可以为规划者提供宝贵的见解。

发布日期:2024-03-01