PTT推薦

Re: [新聞] 監控案鬧大了?于北辰挺王義川怒:電視

看板Gossiping標題Re: [新聞] 監控案鬧大了?于北辰挺王義川怒:電視作者
duckscorpion
(歆)
時間推噓 X 推:5 噓:6 →:35

問一問GPT就有很詳細的分析方式了

重點在於有沒有去識別化

KMT一堆垃圾文組連大數據分析都不懂

難怪連AI產業都反

PS.懶得把GPT回的內容轉繁中了 請不要用這做文章模糊焦點

-----------------------------------------------------
根据手机信号比对两次活动人流,以确定它们是否属于不同族群,是一个复杂但可行的任务。这个过程涉及数据收集、数据分析和模式识别。
以下是一个概述和步骤,说明如何实现这一目标:

### 1. 数据收集

#### a. 获取手机信号数据
- **来源**: 通过移动通信服务提供商或使用专门的设备(如无线信号扫描仪)获取活动期间的手机信号数据。
- **数据类型**: 每个设备的唯一标识符(例如,IMEI 或 IMSI,但需注意隐私保护),信号强度,时间戳,地理位置等。

### 2. 数据处理

#### a. 数据预处理
- **去重**: 清理重复的信号数据。
- **隐私保护**: 将个人标识符进行匿名化处理,以确保隐私保护。
- **时间和位置同步**: 确保数据的时间和位置信息是同步且准确的。

### 3. 数据分析

#### a. 活动人流模式识别
- **聚类分析**: 使用聚类算法(如 K-means、DBSCAN 等)将手机信号数据按活动区域和时间段进行聚类。
- **频率分析**: 分析不同时间段内出现的设备频率。

#### b. 族群识别
- **特征提取**: 从手机信号数据中提取特征,如出现频率、停留时间、移动路径等。
- **机器学习**: 使用监督学习(如分类算法)或无监督学习(如聚类算法)来识别不同活动期间是否存在显著不同的族群。

### 4. 结果验证

#### a. 比对分析
- **交叉验证**: 比较两次活动的人流数据,通过交叉验证来确定是否为不同族群。
- **相似度计算**: 使用相似度指标(如 Jaccard 相似系数)来量化两次活动人流的相似度或差异度。

### 示例步骤

以下是一个简化的示例脚本,使用 Python 和一些常见的数据科学库(如 pandas、scikit-learn)来处理和分析数据。

```python
import pandas as pd
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import StandardScaler

# 假设我们有两个活动期间的手机信号数据
data1 = pd.read_csv('activity1.csv') # 包含 columns: 'device_id', 'timestamp', 'latitude', 'longitude'
data2 = pd.read_csv('activity2.csv')

# 数据预处理
def preprocess(data):
data = data.drop_duplicates(subset=['device_id', 'timestamp'])
data['coords'] = list(zip(data['latitude'], data['longitude']))
return data

data1 = preprocess(data1)
data2 = preprocess(data2)

# 特征提取
def extract_features(data):
scaler = StandardScaler()
coords = scaler.fit_transform(data[['latitude', 'longitude']])
clustering = DBSCAN(eps=0.1, min_samples=10).fit(coords)
data['cluster'] = clustering.labels_
return data

data1 = extract_features(data1)
data2 = extract_features(data2)

# 比对分析
common_devices = set(data1['device_id']).intersection(set(data2['device_id']))unique_to_data1 = set(data1['device_id']) - common_devices
unique_to_data2 = set(data2['device_id']) - common_devices

print(f"共同出现的设备数量: {len(common_devices)}")
print(f"仅在活动1中出现的设备数量: {len(unique_to_data1)}")
print(f"仅在活动2中出现的设备数量: {len(unique_to_data2)}")

# 输出结果
if len(common_devices) / (len(data1['device_id']) + len(data2['device_id'])) < 0.5:
print("两个活动中的人流属于不同的族群。")
else:
print("两个活动中的人流有较大重叠。")
```

### 注意事项
- **隐私保护**: 在处理个人数据时,必须遵守相关法律法规,确保隐私保护。
- **数据质量**: 确保数据的准确性和完整性,以提高分析结果的可靠性。
- **算法选择**: 根据数据特点选择合适的算法进行分析和建模。

通过这些步骤,你可以对比两次活动的人流数据,判断是否属于不同的族群。根据实际需求,还可以进一步细化和优化分析过程。

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.82.73 (臺灣)
PTT 網址

great5566 06/05 16:10用簡體字是不會轉繁體嗎?

froce 06/05 16:11Device id就他媽的已經是個資了好嗎?

froce 06/05 16:11另外要抄你要找套英文的,用中國的code你

froce 06/05 16:11是不是中共同路人?

d8751102 06/05 16:11八又翻

hihimen 06/05 16:12記錄你10年的去向,還要護航哦?

waynecode 06/05 16:14Device ID就是廣告ID,有這個就死定了

killverybig 06/05 16:14426滾啦

notfound0407 06/05 16:14第一句就…

fertalizer 06/05 16:14殘體字

gfabbh 06/05 16:15這次的主要爭議點,又不是技術是否可行,

gfabbh 06/05 16:15而是擅自使用這種技術是否應當?

x0845 06/05 16:15好了啦,我小心憨川用膝蓋就能分析。

lucifiel1618 06/05 16:16你有沒有問它如何蒐集這類資料,有

lucifiel1618 06/05 16:16沒有違反我國法規

gueswmi 06/05 16:21法律角度 我有一份 黃仁勳的去識別化個資

gueswmi 06/05 16:22提供一份(黃仁勳的)去識別化個資 沒違法

gueswmi 06/05 16:22目前來看沒違法 cc

gueswmi 06/05 16:24提供100份黃仁勳"們"的去識別化個資 更沒

adios881 06/05 16:24人權會都繳很清楚啦能 串連出 個資就是

adios881 06/05 16:25違法啊 單筆你不知道誰 沒事 你一做分

adios881 06/05 16:25析串起來瞬間就個資法

gueswmi 06/05 16:25違法 這麼簡單的理解 天下太平

gueswmi 06/05 16:28去識別化的個資 就不叫個資嗎? big ?

adios881 06/05 16:28所以高雄台北都只敢說我們是作量和輪廓

adios881 06/05 16:28一旦像王舉例台中說作到回頭率什麼都就

adios881 06/05 16:28是爭議了

gueswmi 06/05 16:33台中的重遊率看有沒 正當理由

angel902037 06/05 16:41中共同路人

duckscorpion 06/05 16:57那麼怕個資外洩最好不要用googleMap

duckscorpion 06/05 16:58也不要看youtube google都有分析你

IsoRoy 06/05 17:04一直以來這些數據資料電信公司那本就都會

IsoRoy 06/05 17:05有,無論是否有去識別;問題是川他只是黨

IsoRoy 06/05 17:05職欸?可以取得這種級別的資料真的沒有問

IsoRoy 06/05 17:05題嗎?更何況他還自爆可以比對太陽花了,

IsoRoy 06/05 17:0510年前欸,你真覺得這是大數據分析可以比

IsoRoy 06/05 17:05對的喔...

darkMood 06/05 17:07可憐,只有你的是簡中。

geofran 06/05 17:12你連簡轉繁的能力都沒有,還想笑文組喔

iceroy 06/05 17:13技術可行啊,所以才要搞個資法來保護吧

Anvec 06/05 17:19技術可行 但違法

Anvec 06/05 17:20就是曹操他娘的違法 王義川才在那邊詭辯膝

Anvec 06/05 17:21

mersma 06/05 17:46連爭議點都搞不清楚 你還是不要出來丟臉

mersma 06/05 17:46

Qooji 06/05 19:00笑死