Keluarga bahasa ialah sekumpulan bahasa berkait genetik yang dikatakan berasal daripada keturunan bahasa proto yang sama. Kebanyakan bahasa diketahui tergolong dalam sebuah keluarga bahasa atau yang lain. Keluarga yang dicamkan dengan tepat merupakan sebuah unit filogeni, iaitu semua ahlinya berasal daripada leluhur yang sama. Oleh itu, konsep keluarga bahasa melibatkan konsep leluhur genetik sejarah bagi sebuah bahasa, serta membayangkan evolusi sebuah bahasa yang beransur-ansur menjadi bahasa yang lain (bukan penggantian bahasa secara tiba-tiba). Konsep keturunan linguistik adalah tidak begitu ketara berbanding konsep keturunan biologi; umpamanya dalam kes-kes pertembungan bahasa yang berketerlaluan, khususnya dalam pembentukan bahasa-bahasa kreol dan bahasa-bahasa campuran. Dalam kes-kes sebegini, memastikan mana-mana satu bahasa yang boleh dianggap sebagai leluhur untuk sesuatu bahasa adalah amat susah. Bagaimanapun, kes-kes sebegini adalah agak jarang, dan kebanyakan bahasa dapat dikelaskan dengan nyata dalam keluarga-keluarga bahasa.

Taburan keluarga bahasa yang terkini.

Leluhur yang sama untuk sebuah keluarga bahasa jarang dapat diketahui secara langsung kerana kebanyakan bahasa mempunyai sejarah tercatat yang agak pendek. Bagaimanapun, banyak daripada ciri-ciri bahasa proto dapat ditemui semula melalui penggunaan kaedah perbandingan, satu kaedah binaan semula yang diperkenalkan oleh ahli linguistik, August Schleicher, pada abad ke-19. Kaedah ini dapat menunjukkan kesahan untuk banyak daripada keluarga-keluarga cadangan yang disenaraikan di bawah.

Keluarga-keluarga bahasa boleh dibahagikan menjadi unit-unit filogeni yang lebih kecil, secara lazimnya dirujuk sebagai cabang keluarga disebabkan sejarah keluarga bahasa sering diwakili oleh gambar rajah pokok. Bagaimanapun, istilah keluarga tidak dihadkan pada mana-mana satu peringkat "pokok" ini; umpamanya, keluarga Germanik ialah satu cabang bahasa Indo-Eropah. Sesetengah ahli taksonomi mengehadkan istilah keluarga pada peringkat yang tertentu, tetapi tidak terdapat banyak sepersetujuan tentang bagaimana mengolahkannya. Mereka yang menggunakan label ini juga membahagikan cabang menjadi kumpulan-kumpulan, dan kumpulan menjadi kompleks-kompleks. Secara amnya, istilah superkeluarga, filum, dan rumpun dipergunakan untuk kumpulan-kumpulan keluarga bahasa cadangan yang statusnya sebagai unit filogeni dianggap tidak berasas dari segi kaedah-kaedah linguistik sejarah.

Leluhur yang sama untuk bahasa-bahasa yang tergolong dalam sebuah keluarga bahasa dikenali sebagai "bahasa proto". Umpamanya, bahasa proto binaan semula untuk keluarga bahasa Indo-Eropah dikenali sebagai bahasa Indo-Eropah proto. Bahasa proto ini tidak dibuktikan oleh sebarang rekod tertulis kerana ditutur sebelum rekaan tulisan. Bagaimanapun, sebuah bahasa proto kekadang boleh dikenalpasti melalui sebuah bahasa yang diketahui dari segi sejarah. Oleh sebab loghat-loghat provinsi bahasa Latin ("bahasa Latin kasar") melahirkan bahasa-bahasa Romans moden, bahasa Romans proto adalah lebih kurang sama dengan bahasa Latin (jika bukan betul-betul sama dengan bahasa Latin kesusasteraan yang digunakan oleh penulis-penulis klasik), dan loghat-loghat Norse Lama merupakan bahasa proto untuk bahasa Norway, Sweden, Denmark, Faroes, dan Iceland.

Bahasa-bahasa yang tidak dapat digolongkan dengan pasti dalam mana-mana satu keluarga dikenali sebagai pencilan bahasa. Sebuah bahasa yang terasing dalam cabang sendiri (dalam sebuah keluarga) seringnya juga dipanggil sebagai satu pencilan, umpamanya bahasa Greek boleh dirujuk sebagai satu pencilan bahasa Indo-Eropah. Kes-kes sebegini biasanya akan dijelaskan.


Sebilangan golongan bahasa yang utama