DanhengOSM's Comments
| Post | When | Comment |
|---|---|---|
| OSM 上的臺灣電話號碼資料 —— 剪不斷,理還亂 | 首先感谢这篇非常系统、扎实的整理。无论是数据抽样、问题分类,还是对 E.123 / RFC 3966 / E.164 之间关系的梳理,都对理解 OSM 电话标签的现状很有帮助。 从中国大陆社群的角度,此处大体有几点共识,供参考: 1)尊重并理解台湾社群的在地决策 电话格式在很大程度上属于“本地数据治理问题”,与编辑习惯、工具使用乃至社区规模都有关系。既然 E.123 已经在中国台湾数据中形成事实上的主流(de facto standard),推动向该格式收敛,是一个合理且务实的选择。 2)现阶段不存在“一套覆盖两岸四地的统一最终方案” 不同地区在电话号码结构、使用习惯、历史数据积累,以及社区共识上都存在差异。在缺乏跨区域强共识和统一工具链的情况下,强行制定一个“全域标准”反而可能带来更多摩擦和回退编辑。因此,分区域收敛、逐步改善数据质量,可能是更现实的路径。 3)支持中国台湾社群推进 E.123 正规化,并建议扩大交流 将格式统一为 E.123(空格分组)有明显优势:
如果后续有进一步的规范草案或自动化工具(normalizer),也很欢迎在 OSM 跨区域讨论区分享,让包括中国大陆在内的更多使用者参与讨论,看看是否有可借鉴之处(例如在数据清洗、分机处理策略等方面)。 4)关于国家代码问题的一个务实建议 电话国家码本质上属于 ITU 体系下的电信标识。在当前阶段,为了避免非技术性因素影响数据整理工作,我们倾向于将其视为“既有事实数据的一部分”来处理:
先在各自范围内实现格式一致性与数据可用性,再讨论更高层级的统一问题,可能更有利于实际推进。 总体来说,您的报文已经很好地指出了问题的关键:
期待看到社群后续的正规化工具和实践成果,如果有需要跨区域测试或对比数据的地方,也欢迎交流。 |