Marathi (India) Call Center Speech Dataset for Travel

The audio dataset includes call center conversations in Travel, featuring native Marathi speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

40 Speech Hours

Last updated

July 2023

Number of participants

80

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Marathi Language Call Center Speech Dataset for the Travel domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Travel industry.

With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Travel domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Marathi language spoken in India.

Speech Data:

This training dataset comprises 40 hours of call center audio recordings covering various topics and scenarios related to the Travel domain, to build robust and accurate customer service speech technology.

To curate realistic call center interactions, we collaborated with a diverse network of 80 expert native Marathi speakers from different part of Maharashtra. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.

Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.

The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.

Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.

The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Marathi language call center speech recognition models for the Travel domain.

Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.

These ready-to-use transcriptions accelerate the development of Travel call center conversational AI and ASR models for the Marathi language.

Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.

If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.

License:

This Travel call center audio dataset is created by FutureBeeAI and is available for commercial use!

Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Travel sector, our dataset serves as a trusted resource to meet your goals

Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Male(21)Female(56)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.0250.900Speaker 2Hello
Speech1.3502.298Speaker 2<lang:Foreign>Good morning</lang:Foreign>
Speech2.9754.000Speaker 1<lang:Foreign>hello Good morning</lang:Foreign>
Speech5.1746.049Speaker 1तुम्ही कसे आहात?
Speech7.09910.000Speaker 2आम्ही छान आहोत. तुम्ही कसे आहेत?
Speech11.50012.475Speaker 1मी पण
Speech12.64917.975Speaker 1छान आहे. मी तुम्हाला <lang:Foreign>email</lang:Foreign> पाठवली होती मागे <lang:Foreign>tour</lang:Foreign>च्या <lang:Foreign>inquiry</lang:Foreign> बद्दल मिळाली का तुम्हाला?
Speech14.75015.474Speaker 2(())
Speech19.39924.050Speaker 2हो. त्याच्याच करता मी तुम्हाला <lang:Foreign>phone</lang:Foreign> केला की आमची <lang:Foreign>company</lang:Foreign>
Speech24.39929.574Speaker 2<lang:Foreign>tour organize</lang:Foreign> करते तर तुम्हाला तुमच्या <lang:Foreign>requirements</lang:Foreign> मी पाहिल्या.
Speech29.85033.923Speaker 2तर तुम्हाला साधारण एक दीड महिना किंवा दोन महिन्याची
Speech34.50036.250Speaker 2<lang:Foreign>tour organize</lang:Foreign> करायची आहे.
Speech37.79838.649Speaker 2 बरोबर आहे?
Speech39.77444.923Speaker 2तर पहिले एक महिना तुम्ही भारतातच फिरण्याचा तुमचा <lang:Foreign>plan</lang:Foreign> आहे.
Speech40.57541.149Speaker 1हो.
Speech41.52442.074Speaker 1हो हो.
Speech44.72545.225Speaker 1[filler]
Speech46.29851.325Speaker 2[filler]तर त्याच्याबद्दल पण विचारायचं होतं आणि किती जणं आहात तुम्ही?
Speech52.85054.325Speaker 2म्हणजे तसं चालतंय का?
Speech53.92355.375Speaker 1हो. माझं ते भारतात
Speech55.70057.875Speaker 1आधी मला भारतात फिरायचं आहे आणि मग
Speech57.67358.250Speaker 2[filler]
Speech58.20860.808Speaker 1मला युरोपला जायचंय फिरायला.
Speech61.00066.849Speaker 1 [filler] आम्ही चार जण आहोत. माझी आई आहे. माझे बाबा आहेत. माझी बहीण आणि मी स्वतः.
Speech62.42362.975Speaker 2बरं.
Speech68.32576.424Speaker 2बरं. तर त्यांचे तुमचे सगळ्यांचे मला [filler] <lang:Foreign>passport</lang:Foreign> युरोपकरता <lang:Foreign>passport</lang:Foreign> <lang:Foreign>detail</lang:Foreign> वगैरे लागतील. आता तर लागणार नाही.
Speech76.72482.825Speaker 2आणि पैसे तुम्ही भरताना <lang:Foreign>cash</lang:Foreign> भरणार आहे की <lang:Foreign>credit card</lang:Foreign> किंवा <lang:Foreign>G-pay</lang:Foreign> कसं करणार आहे तुम्ही?
Speech83.17483.799Speaker 2त्या
Speech85.97486.625Speaker 1[filler]
Speech86.95088.075Speaker 1पैसे भरताना
Speech88.37592.625Speaker 1<lang:Foreign>cash</lang:Foreign>चं येईन भरायला तुमच्या <lang:Foreign>office</lang:Foreign> मध्ये [filler] कारण की (()) व्हायचा आहे म्हणून.
Speech90.72491.650Speaker 2बरं.
Speech93.90098.000Speaker 2बरं. जवळ आहे का तुम्हाला आमचं <lang:Foreign>office</lang:Foreign> आणि तुमचं घर?
Speech99.682100.757Speaker 1हो माझं <lang:Foreign>office</lang:Foreign>
Speech100.875105.275Speaker 1आणि तुमचं <lang:Foreign>office</lang:Foreign> जवळ आहे तर मला तुमच्याकडे (()) सरळ <lang:Foreign>office</lang:Foreign> नंतर
Speech105.674108.875Speaker 1तुम्ही फक्त मला <lang:Foreign>detail</lang:Foreign> सांगून द्या. त्याप्रमाणे मी पैसे भरीन.
Speech106.200106.974Speaker 2बरं.
Speech110.099110.875Speaker 2चालेल.
Speech111.224117.700Speaker 2तर भारतातले तुम्ही मला चार जागा सांगितल्या. एक कुलू मनाली सांगितलं. शिमला सांगितलं
Speech118.400121.700Speaker 2आणि काश्मीर आणि <lang:Foreign>statue of unity</lang:Foreign>चं
Speech122.025122.875Speaker 2बरोबर आहे?
Speech125.575126.250Speaker 1हो.
Speech126.250131.275Speaker 2<lang:Foreign>okay</lang:Foreign> आणि तुम्ही सगळ्या ठिकाणी <lang:Foreign>flights</lang:Foreign>नी जाणार आहे कसं आहे तुमचा <lang:Foreign>plan</lang:Foreign> तो?
Speech133.175138.973Speaker 1हो. जे सर्व जवळपास जे <lang:Foreign>airport</lang:Foreign> आहेत तिकडनं <lang:Foreign>flight</lang:Foreign> घेऊ आम्ही. <lang:Foreign>flight</lang:Foreign> बघू तिकडनं पुढे गाडी घेऊन जाता येईल मग आम्हाला.
Speech139.500143.250Speaker 2मग <lang:Foreign>car</lang:Foreign> तुम्ही <lang:Foreign>car</lang:Foreign> म्हणजे <lang:Foreign>rent</lang:Foreign> वर राहील
Speech143.550149.598Speaker 2किंवा आम्ही <lang:Foreign>arrange</lang:Foreign> करून देऊ तुम्हाला <lang:Foreign>flight</lang:Foreign>च्या तिकडनं म्हणजे <lang:Foreign>airport</lang:Foreign> वरनं <lang:Foreign>car</lang:Foreign> तुम्हाला <lang:Foreign>arrange</lang:Foreign> केली जाईल.
Speech150.949156.074Speaker 2तिकडनं तुम्ही <lang:Foreign>car</lang:Foreign>नी फिरू शकता. चौघचं जण आहे तर जास्त मोठी गाडी पण तुम्हाला लागणार नाही.
Speech157.973165.150Speaker 2<lang:Foreign>Innova</lang:Foreign> बरोबर राहील कारण सामान पण तुमचं मावून जाईल आणि तुम्हालाही आरामात बसता येईल चौघांनाही.
Speech158.848160.199Speaker 1हो. आम्हाला
Speech167.624172.800Speaker 1हो हो. तसंच करा तुम्ही <lang:Foreign>Innova</lang:Foreign> ठेवा किंवा <lang:Foreign>Fortuner</lang:Foreign> दिली तरी चालण्यासारखं आहे.
Speech173.275174.723Speaker 2हा मग <lang:Foreign>Fortuner</lang:Foreign>
Speech173.275176.550Speaker 1जेवढी मोठी आराम आराम देतील तेवढं चांगलं आहे आम्हाला.
Speech177.324180.848Speaker 2मग <lang:Foreign>Fortuner</lang:Foreign> चांगली राहिलं तर तीच बघूया आपण.

TRANSCRIPTION

TIMETRANSCRIPT
0.025
0.900
Hello
1.350
2.298
<lang:Foreign>Good morning</lang:Foreign>
2.975
4.000
<lang:Foreign>hello Good morning</lang:Foreign>
5.174
6.049
तुम्ही कसे आहात?
7.099
10.000
आम्ही छान आहोत. तुम्ही कसे आहेत?
11.500
12.475
मी पण
12.649
17.975
छान आहे. मी तुम्हाला <lang:Foreign>email</lang:Foreign> पाठवली होती मागे <lang:Foreign>tour</lang:Foreign>च्या <lang:Foreign>inquiry</lang:Foreign> बद्दल मिळाली का तुम्हाला?
14.750
15.474
(())
19.399
24.050
हो. त्याच्याच करता मी तुम्हाला <lang:Foreign>phone</lang:Foreign> केला की आमची <lang:Foreign>company</lang:Foreign>
24.399
29.574
<lang:Foreign>tour organize</lang:Foreign> करते तर तुम्हाला तुमच्या <lang:Foreign>requirements</lang:Foreign> मी पाहिल्या.
29.850
33.923
तर तुम्हाला साधारण एक दीड महिना किंवा दोन महिन्याची
34.500
36.250
<lang:Foreign>tour organize</lang:Foreign> करायची आहे.
37.798
38.649
बरोबर आहे?
39.774
44.923
तर पहिले एक महिना तुम्ही भारतातच फिरण्याचा तुमचा <lang:Foreign>plan</lang:Foreign> आहे.
40.575
41.149
हो.
41.524
42.074
हो हो.
44.725
45.225
[filler]
46.298
51.325
[filler]तर त्याच्याबद्दल पण विचारायचं होतं आणि किती जणं आहात तुम्ही?
52.850
54.325
म्हणजे तसं चालतंय का?
53.923
55.375
हो. माझं ते भारतात
55.700
57.875
आधी मला भारतात फिरायचं आहे आणि मग
57.673
58.250
[filler]
58.208
60.808
मला युरोपला जायचंय फिरायला.
61.000
66.849
[filler] आम्ही चार जण आहोत. माझी आई आहे. माझे बाबा आहेत. माझी बहीण आणि मी स्वतः.
62.423
62.975
बरं.
68.325
76.424
बरं. तर त्यांचे तुमचे सगळ्यांचे मला [filler] <lang:Foreign>passport</lang:Foreign> युरोपकरता <lang:Foreign>passport</lang:Foreign> <lang:Foreign>detail</lang:Foreign> वगैरे लागतील. आता तर लागणार नाही.
76.724
82.825
आणि पैसे तुम्ही भरताना <lang:Foreign>cash</lang:Foreign> भरणार आहे की <lang:Foreign>credit card</lang:Foreign> किंवा <lang:Foreign>G-pay</lang:Foreign> कसं करणार आहे तुम्ही?
83.174
83.799
त्या
85.974
86.625
[filler]
86.950
88.075
पैसे भरताना
88.375
92.625
<lang:Foreign>cash</lang:Foreign>चं येईन भरायला तुमच्या <lang:Foreign>office</lang:Foreign> मध्ये [filler] कारण की (()) व्हायचा आहे म्हणून.
90.724
91.650
बरं.
93.900
98.000
बरं. जवळ आहे का तुम्हाला आमचं <lang:Foreign>office</lang:Foreign> आणि तुमचं घर?
99.682
100.757
हो माझं <lang:Foreign>office</lang:Foreign>
100.875
105.275
आणि तुमचं <lang:Foreign>office</lang:Foreign> जवळ आहे तर मला तुमच्याकडे (()) सरळ <lang:Foreign>office</lang:Foreign> नंतर
105.674
108.875
तुम्ही फक्त मला <lang:Foreign>detail</lang:Foreign> सांगून द्या. त्याप्रमाणे मी पैसे भरीन.
106.200
106.974
बरं.
110.099
110.875
चालेल.
111.224
117.700
तर भारतातले तुम्ही मला चार जागा सांगितल्या. एक कुलू मनाली सांगितलं. शिमला सांगितलं
118.400
121.700
आणि काश्मीर आणि <lang:Foreign>statue of unity</lang:Foreign>चं
122.025
122.875
बरोबर आहे?
125.575
126.250
हो.
126.250
131.275
<lang:Foreign>okay</lang:Foreign> आणि तुम्ही सगळ्या ठिकाणी <lang:Foreign>flights</lang:Foreign>नी जाणार आहे कसं आहे तुमचा <lang:Foreign>plan</lang:Foreign> तो?
133.175
138.973
हो. जे सर्व जवळपास जे <lang:Foreign>airport</lang:Foreign> आहेत तिकडनं <lang:Foreign>flight</lang:Foreign> घेऊ आम्ही. <lang:Foreign>flight</lang:Foreign> बघू तिकडनं पुढे गाडी घेऊन जाता येईल मग आम्हाला.
139.500
143.250
मग <lang:Foreign>car</lang:Foreign> तुम्ही <lang:Foreign>car</lang:Foreign> म्हणजे <lang:Foreign>rent</lang:Foreign> वर राहील
143.550
149.598
किंवा आम्ही <lang:Foreign>arrange</lang:Foreign> करून देऊ तुम्हाला <lang:Foreign>flight</lang:Foreign>च्या तिकडनं म्हणजे <lang:Foreign>airport</lang:Foreign> वरनं <lang:Foreign>car</lang:Foreign> तुम्हाला <lang:Foreign>arrange</lang:Foreign> केली जाईल.
150.949
156.074
तिकडनं तुम्ही <lang:Foreign>car</lang:Foreign>नी फिरू शकता. चौघचं जण आहे तर जास्त मोठी गाडी पण तुम्हाला लागणार नाही.
157.973
165.150
<lang:Foreign>Innova</lang:Foreign> बरोबर राहील कारण सामान पण तुमचं मावून जाईल आणि तुम्हालाही आरामात बसता येईल चौघांनाही.
158.848
160.199
हो. आम्हाला
167.624
172.800
हो हो. तसंच करा तुम्ही <lang:Foreign>Innova</lang:Foreign> ठेवा किंवा <lang:Foreign>Fortuner</lang:Foreign> दिली तरी चालण्यासारखं आहे.
173.275
174.723
हा मग <lang:Foreign>Fortuner</lang:Foreign>
173.275
176.550
जेवढी मोठी आराम आराम देतील तेवढं चांगलं आहे आम्हाला.
177.324
180.848
मग <lang:Foreign>Fortuner</lang:Foreign> चांगली राहिलं तर तीच बघूया आपण.

Dataset Demographics

Details Headline

Language

Marathi

Language code

mr-in

Country

India

Accents

Varhadi,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg