Kumpulan Data yang Kami Lihat Minggu Ini

Kumpulan Data yang Kami Lihat Minggu Ini

Anda sedang membaca Data Itu Jamak, buletin mingguan kumpulan data yang berguna/ingin tahu. Di bawah ini Anda akan menemukan 10 Agustus 2022, edisidicetak ulang dengan izin di FiveThirtyEight.

Edisi 2022.08.10

Migrasi dewasa muda, modal sosial, CPU dan GPU, perdagangan di Italia pasca-penyatuan dan “Star Trek” pembicaraan komputer.

Migrasi dewasa muda. Para peneliti di Universitas Harvard dan Biro Sensus AS telah menghubungkan pengajuan pajak federal, catatan sensus, dan data pemerintah lainnya untuk melacak pola migrasi penduduk muda AS. Secara khusus, untuk setiap orang yang lahir di AS antara tahun 1984 dan 1992, para peneliti membandingkan tempat tinggal mereka pada usia 16 tahun dengan tempat mereka tinggal pada usia 26 tahun. Dataset publik proyek menghitung perkiraan jumlah yang pindah ke/dari setiap pasangan zona perjalanan — secara keseluruhan dan dipilah berdasarkan ras/etnis dan tingkat pendapatan orang tua. Baca lebih banyak: Resep pelaporan dari Brent Jones dan Eric Schmid, yang menganalisis data untuk St. Louis Public Radio.

Modal sosial. Menggunakan data miliaran koneksi Facebook dan keanggotaan grup, Atlas Modal Sosial Raj Chetty dkk. menghitung tiga metrik untuk negara bagian AS, kode pos, sekolah menengah dan perguruan tinggi: keterhubungan ekonomi (persahabatan antara pengguna berpenghasilan rendah dan berpenghasilan tinggi) , keterpaduan (seberapa sering teman pengguna juga berteman satu sama lain) dan keterlibatan sipil (keanggotaan dalam kelompok sukarelawan). Baca lebih banyak: Hasil mengeksplorasi dan menjelaskan temuan proyek. Sebelumnya: Pengukuran keterhubungan sosial (DIP 2020.09.30) dan mobilitas ekonomi (DIP 2019.06.12) dari beberapa peneliti yang sama. [h/t Johannes Stroebel]

CPU dan GPU. Yifan Sun et al., berusaha untuk menguji Hukum Moore dan penskalaan Dennard, “telah mengumpulkan data untuk semua produk CPU dan GPU (sepengetahuan kami) yang telah dirilis oleh Intel, AMD […] dan NVIDIA sejak 1 Januari 2000.” Dataset dan alat bagan penulis, yang menjelaskan lebih dari 4.800 prosesor hingga awal 2021, menggunakan informasi yang dikumpulkan dari TechPowerUp, WikiChip, dan situs web perusahaan. Mereka mengidentifikasi setiap vendor produk, tanggal rilis, jumlah transistor, frekuensi dasar, dan detail lainnya. [h/t matt_d]

Perdagangan di Italia pasca-unifikasi. Proyek Lost Highway, sebuah kolaborasi antara peneliti di empat universitas Italia, bertujuan “untuk menguji sejumlah dugaan sejarah yang luas tentang kekurangan jangka panjang dari jalur pengembangan Italia dengan mengumpulkan sebanyak mungkin bukti kuantitatif.” Basis data Bankit-FTV-nya menyediakan total impor dan ekspor tahunan untuk tahun 1862 hingga 1939, berdasarkan produk dan mitra dagang, dengan lebih dari 6.000 deskripsi produk yang distandarisasi menjadi sekitar 600 pengelompokan komoditas. [h/t Francesco Piccinelli Casagrande]

“Teh, Earl Grey, panas.” Menyisir transkrip lengkap “Star Trek: The Next Generation,” Benett Axtell dan Cosmin Munteanu menemukan lebih dari 1.000 baris dialog antara karakter pertunjukan dan komputer kapal luar angkasa Enterprise. Kumpulan data mereka tentang interaksi ini mencantumkan frasa, karakter, jenis interaksi, arah panggung setiap baris, dan banyak lagi. [h/t Christian A. Gebhard + Sara Stoudt + Tidy Tuesday]

Saran kumpulan data? Kritik? Memuji? Kirim umpan balik ke [email protected]. Mencari kumpulan data sebelumnya? Spreadsheet ini berisi semuanya. Mengunjungi data-is-plural.com untuk berlangganan dan menelusuri edisi sebelumnya.