Gujarati (India) General Conversation Speech Dataset

The audio dataset consist of general conversations between native Gujarati people from India along with metadata and transcription.

Category

Unscripted General Conversations

Total Volume

60 Speech Hours

Last updated

July 2023

Number of participants

80

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Gujarati Language General Conversation Speech Dataset, a comprehensive and diverse collection of voice data specifically curated to advance the development of Gujarati language speech recognition models, with a particular focus on Indian accents and dialects.

With high-quality audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and Generative Voice AI algorithms. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Gujarati language spoken in India.

Speech Data:

This training dataset comprises 50 hours of audio recordings covering a wide range of topics and scenarios, ensuring robustness and accuracy in speech technology applications. To achieve this, we collaborated with a diverse network of 70 native Gujarati speakers from different part of Gujarat. This collaborative effort guarantees a balanced representation of Indian accents, dialects, and demographics, reducing biases and promoting inclusivity.

Each audio recording captures the essence of spontaneous, unscripted conversations between two individuals, with an average duration ranging from 15 to 60 minutes. The speech data is available in WAV format, with stereo channel files having a bit depth of 16 bits and a sample rate of 8 kHz. The recording environment is generally quiet, without background noise and echo.

Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This metadata includes the participant's age, gender, country, state, and dialect. Furthermore, additional metadata such as recording device detail, topic of recording, bit depth, and sample rate will be provided.

The metadata serves as a valuable tool for understanding and characterizing the data, facilitating informed decision-making in the development of Gujarati language speech recognition models.

Transcription:

This dataset provides a manual verbatim transcription of each audio file to enhance your workflow efficiency. The transcriptions are available in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags.

Our goal is to expedite the deployment of Gujarati language conversational AI and NLP models by offering ready-to-use transcriptions, ultimately saving valuable time and resources in the development process.

Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our voice dataset is regularly updated with new audio data captured in diverse real-world conditions.

If you require a custom training dataset with specific environmental conditions such as in-car, busy street, restaurant, or any other scenario, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.

License:

This audio dataset, created by FutureBeeAI, is now available for commercial use.

Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, exploring generative voice AI, or building cutting-edge voice assistants and bots, our dataset serves as a reliable and valuable resource.

Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Male(21)Male(25)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.0001.255Speaker 1તું કેમ છે મજામાં?
Speech1.4754.225Speaker 2હા ભાઈ દર્શન એકદમ મજામાં.
Speech6.0258.250Speaker 1શું કરે છે આજ કાલ હમણાંનો મળ્યો નથી?
Speech9.60813.400Speaker 2અરે યાર આ બધું મતલબ <lang:Foreign>busy</lang:Foreign> છું હાલ બધું <lang:Foreign>politics</lang:Foreign> નું થોડું
Speech14.02518.608Speaker 2મારે <lang:Foreign>knowledge</lang:Foreign> લેવું હતું કારણ કે શું મારે પછી આગળ જઈને નેતા બનવું છે.
Speech20.27528.353Speaker 1અરે યાર આ તો બહુ સરસ વાત કરી તો ચાલ તને <lang:Foreign>politics</lang:Foreign> વિશે થોડું સમજાવી શકું છું મારે પાસે ગણીજ <lang:Foreign>knowledge</lang:Foreign> છે, તને ખબર છે ને મેં <lang:Foreign>politics</lang:Foreign> માં મારું <lang:Foreign>graduation</lang:Foreign> પૂરું કર્યું છે <lang:Foreign><initial>B.A</initial></lang:Foreign> માં.
Speech30.96132.098Speaker 2અચ્છા, એવું છે?
Speech33.52948.510Speaker 1તો જો પહેલાના જમાનાની વાત કરીએ કે અકબર અને એ બધા જેવા રાજાઓ હતા તે <lang:Foreign>time</lang:Foreign> પણ <lang:Foreign>politics</lang:Foreign> તો હતું જ પણ એ <lang:Foreign>time</lang:Foreign> શું હતું કે રાજાઓ માટે પોતાની પ્રજા એ #આહ સૌપ્રથમ સ્થાને હતી જે મહાન રાજાઓ હતા જેમ કે મહારાણા પ્રતાપ, શિવાજી મહારાજ, અકબર, બીરબલ,
Speech48.93252.540Speaker 1આ બધા જે હતા એમાં શું હતું એમના માટે <lang:Foreign>top priority</lang:Foreign> હતી એમની પ્રજા.
Speech53.78457.124Speaker 1અને #આહ હવા, હવેની તો વાત આપણે પછી કરીશું
Speech57.52468.765Speaker 1અને પછી જો કે #આહ એ <lang:Foreign>time</lang:Foreign> એમનું જે રાજ્ય હતું એ (()) થી ચાલતું હતું એક બીજા પાર આક્રમણ કરી રાજ્યો જીતતા પણ પ્રજાનો પણ તે સંભાળ રાખતા હતા અને પછી #આહ
Speech70.11873.124Speaker 1શું થયું કે #આહ રા, મહા જેમકે #આહ
Speech73.52483.886Speaker 1મુઘલ યુગ શરુ થયો એ <lang:Foreign>time</lang:Foreign> એ <lang:Foreign>politics</lang:Foreign> ની દિશા બદલાઈ ગઈ મેં વાંચ્યું હતું મારા અભ્યાસક્રમમાં એ તે <lang:Foreign>time</lang:Foreign> ની શાશન પદ્ધતિ હતી એ અલગ હતી બધા રાજાઓની શાશન પદ્ધતિ અલગ હતી
Speech84.48685.039Speaker 1કોઈ
Speech85.37394.725Speaker 1એવા પણ રાજા હતા જે પ્રજા પર જુલ્મ કરતા કે એ એવું સાબીત કરવા માંગતા હતા કે તેજ મહાન છે જેમ કે મહાન રાજા સિકંદર હતો એ શું કરતો હતો કે દુનિયા પર ચડાઈ કરી હતી અને એણે,
Speech94.826100.569Speaker 1તે આખી દુનિયાને જીતવા માંગતો હતો પણ ગમ્મે એ ગમ્મે તે ભીગે જીતવા માંગતો હતો આવા પણ રાજા હતા, તું જાણે છે આ બધા વિશે ?
Speech104.569118.980Speaker 2હા મતલબ મને જ્યારે હું #આહ <lang:Foreign>school</lang:Foreign> માં ભણતો ત્યારે મતલબ મને ભણવામાં આવતુ હતું આ બધા મતલબ અભ્યાસક્રમમાં હતું પણ મને એટલું પણ મતલબ <lang:Foreign>knowledge</lang:Foreign> નથી કે એ રાજાઓ મતલબ કઈ રીતે જીવતા એમનો મતલબ એમની જીવન શૈલી કઈ રીતની હતી કેટલી રાણીઓ હતી,
Speech119.451124.843Speaker 2કેવી રીતે એ લોકો <lang:Foreign>enjoy</lang:Foreign> કરતા, તો તને ખ્યાલ હોય તો મને બતાઓને મતલબ શું હતું અને શું ન હતું.
Speech126.588138.706Speaker 1હા, તો <lang:Foreign>politics</lang:Foreign> માં એ <lang:Foreign>time</lang:Foreign> પર મંત્રીઓ હતા એમના રાજકારણ વતી કે અકબરના અંદર નવરત્ન નવ મંત્રીઓ હતા તો રાજા જેને કઈ કામ કરે તો તે પહેલા મંત્રીઓ પાસેથી સલાહ લે અને પછી આગળ વધતો.
Speech138.922150.529Speaker 1અત્યારે પણ એવુજ છે પણ આપણે અત્યારે <lang:Foreign>ancient India</lang:Foreign> ની વાત કરી રહ્યા છીએ તો જોવો, રાજા મંત્રીઓ પાસે સલાહ લે અને પછી તે કામને આગળ વધારે એની સાથે સાથે ગુપ્તચરો પણ એના <lang:Foreign>time</lang:Foreign> માં હતા કે,
Speech150.745161.137Speaker 1કોઈ પ્રદેશમાં શું થઇ રહ્યું છે ત્યાં તેમના ગુપ્તચરો હોય તેમના <lang:Foreign>sources</lang:Foreign> હોય અત્યારના જમાનામાં <lang:Foreign>sources</lang:Foreign> કહેવાય તો એ પણ એની હલન ચલન પર નજર રાખે અને #આહ ગુપ્તચર સંદેશો મોકલતા,
Speech161.608165.835Speaker 1તો એ <lang:Foreign>time politics</lang:Foreign> પણ આમ જોવા જઈએ તો ગણું સારું હતું અત્યારના જમાના કરતા,
Speech166.210169.373Speaker 1તો તું #આહ શું <lang:Foreign>past</lang:Foreign> નું <lang:Foreign>add</lang:Foreign> કરવા માંગીશ?
Speech172.502178.052Speaker 2હા ચોક્કસ ભાઈ કારણ કે <lang:Foreign>past</lang:Foreign> થી તો મતલબ આપણી શરૂઆત થઇ હતી મતલબ જે <lang:Foreign>politics</lang:Foreign> ને જે બધી વાતો હતી.

TRANSCRIPTION

TIMETRANSCRIPT
0.000
1.255
તું કેમ છે મજામાં?
1.475
4.225
હા ભાઈ દર્શન એકદમ મજામાં.
6.025
8.250
શું કરે છે આજ કાલ હમણાંનો મળ્યો નથી?
9.608
13.400
અરે યાર આ બધું મતલબ <lang:Foreign>busy</lang:Foreign> છું હાલ બધું <lang:Foreign>politics</lang:Foreign> નું થોડું
14.025
18.608
મારે <lang:Foreign>knowledge</lang:Foreign> લેવું હતું કારણ કે શું મારે પછી આગળ જઈને નેતા બનવું છે.
20.275
28.353
અરે યાર આ તો બહુ સરસ વાત કરી તો ચાલ તને <lang:Foreign>politics</lang:Foreign> વિશે થોડું સમજાવી શકું છું મારે પાસે ગણીજ <lang:Foreign>knowledge</lang:Foreign> છે, તને ખબર છે ને મેં <lang:Foreign>politics</lang:Foreign> માં મારું <lang:Foreign>graduation</lang:Foreign> પૂરું કર્યું છે <lang:Foreign><initial>B.A</initial></lang:Foreign> માં.
30.961
32.098
અચ્છા, એવું છે?
33.529
48.510
તો જો પહેલાના જમાનાની વાત કરીએ કે અકબર અને એ બધા જેવા રાજાઓ હતા તે <lang:Foreign>time</lang:Foreign> પણ <lang:Foreign>politics</lang:Foreign> તો હતું જ પણ એ <lang:Foreign>time</lang:Foreign> શું હતું કે રાજાઓ માટે પોતાની પ્રજા એ #આહ સૌપ્રથમ સ્થાને હતી જે મહાન રાજાઓ હતા જેમ કે મહારાણા પ્રતાપ, શિવાજી મહારાજ, અકબર, બીરબલ,
48.932
52.540
આ બધા જે હતા એમાં શું હતું એમના માટે <lang:Foreign>top priority</lang:Foreign> હતી એમની પ્રજા.
53.784
57.124
અને #આહ હવા, હવેની તો વાત આપણે પછી કરીશું
57.524
68.765
અને પછી જો કે #આહ એ <lang:Foreign>time</lang:Foreign> એમનું જે રાજ્ય હતું એ (()) થી ચાલતું હતું એક બીજા પાર આક્રમણ કરી રાજ્યો જીતતા પણ પ્રજાનો પણ તે સંભાળ રાખતા હતા અને પછી #આહ
70.118
73.124
શું થયું કે #આહ રા, મહા જેમકે #આહ
73.524
83.886
મુઘલ યુગ શરુ થયો એ <lang:Foreign>time</lang:Foreign> એ <lang:Foreign>politics</lang:Foreign> ની દિશા બદલાઈ ગઈ મેં વાંચ્યું હતું મારા અભ્યાસક્રમમાં એ તે <lang:Foreign>time</lang:Foreign> ની શાશન પદ્ધતિ હતી એ અલગ હતી બધા રાજાઓની શાશન પદ્ધતિ અલગ હતી
84.486
85.039
કોઈ
85.373
94.725
એવા પણ રાજા હતા જે પ્રજા પર જુલ્મ કરતા કે એ એવું સાબીત કરવા માંગતા હતા કે તેજ મહાન છે જેમ કે મહાન રાજા સિકંદર હતો એ શું કરતો હતો કે દુનિયા પર ચડાઈ કરી હતી અને એણે,
94.826
100.569
તે આખી દુનિયાને જીતવા માંગતો હતો પણ ગમ્મે એ ગમ્મે તે ભીગે જીતવા માંગતો હતો આવા પણ રાજા હતા, તું જાણે છે આ બધા વિશે ?
104.569
118.980
હા મતલબ મને જ્યારે હું #આહ <lang:Foreign>school</lang:Foreign> માં ભણતો ત્યારે મતલબ મને ભણવામાં આવતુ હતું આ બધા મતલબ અભ્યાસક્રમમાં હતું પણ મને એટલું પણ મતલબ <lang:Foreign>knowledge</lang:Foreign> નથી કે એ રાજાઓ મતલબ કઈ રીતે જીવતા એમનો મતલબ એમની જીવન શૈલી કઈ રીતની હતી કેટલી રાણીઓ હતી,
119.451
124.843
કેવી રીતે એ લોકો <lang:Foreign>enjoy</lang:Foreign> કરતા, તો તને ખ્યાલ હોય તો મને બતાઓને મતલબ શું હતું અને શું ન હતું.
126.588
138.706
હા, તો <lang:Foreign>politics</lang:Foreign> માં એ <lang:Foreign>time</lang:Foreign> પર મંત્રીઓ હતા એમના રાજકારણ વતી કે અકબરના અંદર નવરત્ન નવ મંત્રીઓ હતા તો રાજા જેને કઈ કામ કરે તો તે પહેલા મંત્રીઓ પાસેથી સલાહ લે અને પછી આગળ વધતો.
138.922
150.529
અત્યારે પણ એવુજ છે પણ આપણે અત્યારે <lang:Foreign>ancient India</lang:Foreign> ની વાત કરી રહ્યા છીએ તો જોવો, રાજા મંત્રીઓ પાસે સલાહ લે અને પછી તે કામને આગળ વધારે એની સાથે સાથે ગુપ્તચરો પણ એના <lang:Foreign>time</lang:Foreign> માં હતા કે,
150.745
161.137
કોઈ પ્રદેશમાં શું થઇ રહ્યું છે ત્યાં તેમના ગુપ્તચરો હોય તેમના <lang:Foreign>sources</lang:Foreign> હોય અત્યારના જમાનામાં <lang:Foreign>sources</lang:Foreign> કહેવાય તો એ પણ એની હલન ચલન પર નજર રાખે અને #આહ ગુપ્તચર સંદેશો મોકલતા,
161.608
165.835
તો એ <lang:Foreign>time politics</lang:Foreign> પણ આમ જોવા જઈએ તો ગણું સારું હતું અત્યારના જમાના કરતા,
166.210
169.373
તો તું #આહ શું <lang:Foreign>past</lang:Foreign> નું <lang:Foreign>add</lang:Foreign> કરવા માંગીશ?
172.502
178.052
હા ચોક્કસ ભાઈ કારણ કે <lang:Foreign>past</lang:Foreign> થી તો મતલબ આપણી શરૂઆત થઇ હતી મતલબ જે <lang:Foreign>politics</lang:Foreign> ને જે બધી વાતો હતી.

Dataset Demographics

Details Headline

Language

Gujarati

Language code

gu-in

Country

India

Accents

Kathiawari,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

15-60 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg