We Use Cookies!!!
We use cookies to ensure that we give you the best experience on our website. Read cookies policies.
The audio dataset includes call center conversations in Travel, featuring native Marathi speakers from India, with detailed metadata and accurate transcriptions.
Unscripted Call Center Conversations
40 Speech Hours
July 2023
80
Welcome to the Marathi Language Call Center Speech Dataset for the Travel domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Travel industry.
With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Travel domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Marathi language spoken in India.
Speech Data:
This training dataset comprises 40 hours of call center audio recordings covering various topics and scenarios related to the Travel domain, to build robust and accurate customer service speech technology.
To curate realistic call center interactions, we collaborated with a diverse network of 80 expert native Marathi speakers from different part of Maharashtra. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.
Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.
The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.
Metadata:
In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.
The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Marathi language call center speech recognition models for the Travel domain.
Transcription:
To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.
These ready-to-use transcriptions accelerate the development of Travel call center conversational AI and ASR models for the Marathi language.
Updates and Customization:
We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.
If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.
License:
This Travel call center audio dataset is created by FutureBeeAI and is available for commercial use!
Conclusion:
Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Travel sector, our dataset serves as a trusted resource to meet your goals
Channel 1 | Channel 2 | Format |
---|---|---|
Male(21) | Female(56) | wav, json |
LABEL | START | END | CHANNEL | TRANSCRIPT |
---|---|---|---|---|
Speech | 0.025 | 0.900 | Speaker 2 | Hello |
Speech | 1.350 | 2.298 | Speaker 2 | <lang:Foreign>Good morning</lang:Foreign> |
Speech | 2.975 | 4.000 | Speaker 1 | <lang:Foreign>hello Good morning</lang:Foreign> |
Speech | 5.174 | 6.049 | Speaker 1 | तुम्ही कसे आहात? |
Speech | 7.099 | 10.000 | Speaker 2 | आम्ही छान आहोत. तुम्ही कसे आहेत? |
Speech | 11.500 | 12.475 | Speaker 1 | मी पण |
Speech | 12.649 | 17.975 | Speaker 1 | छान आहे. मी तुम्हाला <lang:Foreign>email</lang:Foreign> पाठवली होती मागे <lang:Foreign>tour</lang:Foreign>च्या <lang:Foreign>inquiry</lang:Foreign> बद्दल मिळाली का तुम्हाला? |
Speech | 14.750 | 15.474 | Speaker 2 | (()) |
Speech | 19.399 | 24.050 | Speaker 2 | हो. त्याच्याच करता मी तुम्हाला <lang:Foreign>phone</lang:Foreign> केला की आमची <lang:Foreign>company</lang:Foreign> |
Speech | 24.399 | 29.574 | Speaker 2 | <lang:Foreign>tour organize</lang:Foreign> करते तर तुम्हाला तुमच्या <lang:Foreign>requirements</lang:Foreign> मी पाहिल्या. |
Speech | 29.850 | 33.923 | Speaker 2 | तर तुम्हाला साधारण एक दीड महिना किंवा दोन महिन्याची |
Speech | 34.500 | 36.250 | Speaker 2 | <lang:Foreign>tour organize</lang:Foreign> करायची आहे. |
Speech | 37.798 | 38.649 | Speaker 2 | बरोबर आहे? |
Speech | 39.774 | 44.923 | Speaker 2 | तर पहिले एक महिना तुम्ही भारतातच फिरण्याचा तुमचा <lang:Foreign>plan</lang:Foreign> आहे. |
Speech | 40.575 | 41.149 | Speaker 1 | हो. |
Speech | 41.524 | 42.074 | Speaker 1 | हो हो. |
Speech | 44.725 | 45.225 | Speaker 1 | [filler] |
Speech | 46.298 | 51.325 | Speaker 2 | [filler]तर त्याच्याबद्दल पण विचारायचं होतं आणि किती जणं आहात तुम्ही? |
Speech | 52.850 | 54.325 | Speaker 2 | म्हणजे तसं चालतंय का? |
Speech | 53.923 | 55.375 | Speaker 1 | हो. माझं ते भारतात |
Speech | 55.700 | 57.875 | Speaker 1 | आधी मला भारतात फिरायचं आहे आणि मग |
Speech | 57.673 | 58.250 | Speaker 2 | [filler] |
Speech | 58.208 | 60.808 | Speaker 1 | मला युरोपला जायचंय फिरायला. |
Speech | 61.000 | 66.849 | Speaker 1 | [filler] आम्ही चार जण आहोत. माझी आई आहे. माझे बाबा आहेत. माझी बहीण आणि मी स्वतः. |
Speech | 62.423 | 62.975 | Speaker 2 | बरं. |
Speech | 68.325 | 76.424 | Speaker 2 | बरं. तर त्यांचे तुमचे सगळ्यांचे मला [filler] <lang:Foreign>passport</lang:Foreign> युरोपकरता <lang:Foreign>passport</lang:Foreign> <lang:Foreign>detail</lang:Foreign> वगैरे लागतील. आता तर लागणार नाही. |
Speech | 76.724 | 82.825 | Speaker 2 | आणि पैसे तुम्ही भरताना <lang:Foreign>cash</lang:Foreign> भरणार आहे की <lang:Foreign>credit card</lang:Foreign> किंवा <lang:Foreign>G-pay</lang:Foreign> कसं करणार आहे तुम्ही? |
Speech | 83.174 | 83.799 | Speaker 2 | त्या |
Speech | 85.974 | 86.625 | Speaker 1 | [filler] |
Speech | 86.950 | 88.075 | Speaker 1 | पैसे भरताना |
Speech | 88.375 | 92.625 | Speaker 1 | <lang:Foreign>cash</lang:Foreign>चं येईन भरायला तुमच्या <lang:Foreign>office</lang:Foreign> मध्ये [filler] कारण की (()) व्हायचा आहे म्हणून. |
Speech | 90.724 | 91.650 | Speaker 2 | बरं. |
Speech | 93.900 | 98.000 | Speaker 2 | बरं. जवळ आहे का तुम्हाला आमचं <lang:Foreign>office</lang:Foreign> आणि तुमचं घर? |
Speech | 99.682 | 100.757 | Speaker 1 | हो माझं <lang:Foreign>office</lang:Foreign> |
Speech | 100.875 | 105.275 | Speaker 1 | आणि तुमचं <lang:Foreign>office</lang:Foreign> जवळ आहे तर मला तुमच्याकडे (()) सरळ <lang:Foreign>office</lang:Foreign> नंतर |
Speech | 105.674 | 108.875 | Speaker 1 | तुम्ही फक्त मला <lang:Foreign>detail</lang:Foreign> सांगून द्या. त्याप्रमाणे मी पैसे भरीन. |
Speech | 106.200 | 106.974 | Speaker 2 | बरं. |
Speech | 110.099 | 110.875 | Speaker 2 | चालेल. |
Speech | 111.224 | 117.700 | Speaker 2 | तर भारतातले तुम्ही मला चार जागा सांगितल्या. एक कुलू मनाली सांगितलं. शिमला सांगितलं |
Speech | 118.400 | 121.700 | Speaker 2 | आणि काश्मीर आणि <lang:Foreign>statue of unity</lang:Foreign>चं |
Speech | 122.025 | 122.875 | Speaker 2 | बरोबर आहे? |
Speech | 125.575 | 126.250 | Speaker 1 | हो. |
Speech | 126.250 | 131.275 | Speaker 2 | <lang:Foreign>okay</lang:Foreign> आणि तुम्ही सगळ्या ठिकाणी <lang:Foreign>flights</lang:Foreign>नी जाणार आहे कसं आहे तुमचा <lang:Foreign>plan</lang:Foreign> तो? |
Speech | 133.175 | 138.973 | Speaker 1 | हो. जे सर्व जवळपास जे <lang:Foreign>airport</lang:Foreign> आहेत तिकडनं <lang:Foreign>flight</lang:Foreign> घेऊ आम्ही. <lang:Foreign>flight</lang:Foreign> बघू तिकडनं पुढे गाडी घेऊन जाता येईल मग आम्हाला. |
Speech | 139.500 | 143.250 | Speaker 2 | मग <lang:Foreign>car</lang:Foreign> तुम्ही <lang:Foreign>car</lang:Foreign> म्हणजे <lang:Foreign>rent</lang:Foreign> वर राहील |
Speech | 143.550 | 149.598 | Speaker 2 | किंवा आम्ही <lang:Foreign>arrange</lang:Foreign> करून देऊ तुम्हाला <lang:Foreign>flight</lang:Foreign>च्या तिकडनं म्हणजे <lang:Foreign>airport</lang:Foreign> वरनं <lang:Foreign>car</lang:Foreign> तुम्हाला <lang:Foreign>arrange</lang:Foreign> केली जाईल. |
Speech | 150.949 | 156.074 | Speaker 2 | तिकडनं तुम्ही <lang:Foreign>car</lang:Foreign>नी फिरू शकता. चौघचं जण आहे तर जास्त मोठी गाडी पण तुम्हाला लागणार नाही. |
Speech | 157.973 | 165.150 | Speaker 2 | <lang:Foreign>Innova</lang:Foreign> बरोबर राहील कारण सामान पण तुमचं मावून जाईल आणि तुम्हालाही आरामात बसता येईल चौघांनाही. |
Speech | 158.848 | 160.199 | Speaker 1 | हो. आम्हाला |
Speech | 167.624 | 172.800 | Speaker 1 | हो हो. तसंच करा तुम्ही <lang:Foreign>Innova</lang:Foreign> ठेवा किंवा <lang:Foreign>Fortuner</lang:Foreign> दिली तरी चालण्यासारखं आहे. |
Speech | 173.275 | 174.723 | Speaker 2 | हा मग <lang:Foreign>Fortuner</lang:Foreign> |
Speech | 173.275 | 176.550 | Speaker 1 | जेवढी मोठी आराम आराम देतील तेवढं चांगलं आहे आम्हाला. |
Speech | 177.324 | 180.848 | Speaker 2 | मग <lang:Foreign>Fortuner</lang:Foreign> चांगली राहिलं तर तीच बघूया आपण. |
TIME | TRANSCRIPT |
---|---|
0.025 0.900 | Hello |
1.350 2.298 | <lang:Foreign>Good morning</lang:Foreign> |
2.975 4.000 | <lang:Foreign>hello Good morning</lang:Foreign> |
5.174 6.049 | तुम्ही कसे आहात? |
7.099 10.000 | आम्ही छान आहोत. तुम्ही कसे आहेत? |
11.500 12.475 | मी पण |
12.649 17.975 | छान आहे. मी तुम्हाला <lang:Foreign>email</lang:Foreign> पाठवली होती मागे <lang:Foreign>tour</lang:Foreign>च्या <lang:Foreign>inquiry</lang:Foreign> बद्दल मिळाली का तुम्हाला? |
14.750 15.474 | (()) |
19.399 24.050 | हो. त्याच्याच करता मी तुम्हाला <lang:Foreign>phone</lang:Foreign> केला की आमची <lang:Foreign>company</lang:Foreign> |
24.399 29.574 | <lang:Foreign>tour organize</lang:Foreign> करते तर तुम्हाला तुमच्या <lang:Foreign>requirements</lang:Foreign> मी पाहिल्या. |
29.850 33.923 | तर तुम्हाला साधारण एक दीड महिना किंवा दोन महिन्याची |
34.500 36.250 | <lang:Foreign>tour organize</lang:Foreign> करायची आहे. |
37.798 38.649 | बरोबर आहे? |
39.774 44.923 | तर पहिले एक महिना तुम्ही भारतातच फिरण्याचा तुमचा <lang:Foreign>plan</lang:Foreign> आहे. |
40.575 41.149 | हो. |
41.524 42.074 | हो हो. |
44.725 45.225 | [filler] |
46.298 51.325 | [filler]तर त्याच्याबद्दल पण विचारायचं होतं आणि किती जणं आहात तुम्ही? |
52.850 54.325 | म्हणजे तसं चालतंय का? |
53.923 55.375 | हो. माझं ते भारतात |
55.700 57.875 | आधी मला भारतात फिरायचं आहे आणि मग |
57.673 58.250 | [filler] |
58.208 60.808 | मला युरोपला जायचंय फिरायला. |
61.000 66.849 | [filler] आम्ही चार जण आहोत. माझी आई आहे. माझे बाबा आहेत. माझी बहीण आणि मी स्वतः. |
62.423 62.975 | बरं. |
68.325 76.424 | बरं. तर त्यांचे तुमचे सगळ्यांचे मला [filler] <lang:Foreign>passport</lang:Foreign> युरोपकरता <lang:Foreign>passport</lang:Foreign> <lang:Foreign>detail</lang:Foreign> वगैरे लागतील. आता तर लागणार नाही. |
76.724 82.825 | आणि पैसे तुम्ही भरताना <lang:Foreign>cash</lang:Foreign> भरणार आहे की <lang:Foreign>credit card</lang:Foreign> किंवा <lang:Foreign>G-pay</lang:Foreign> कसं करणार आहे तुम्ही? |
83.174 83.799 | त्या |
85.974 86.625 | [filler] |
86.950 88.075 | पैसे भरताना |
88.375 92.625 | <lang:Foreign>cash</lang:Foreign>चं येईन भरायला तुमच्या <lang:Foreign>office</lang:Foreign> मध्ये [filler] कारण की (()) व्हायचा आहे म्हणून. |
90.724 91.650 | बरं. |
93.900 98.000 | बरं. जवळ आहे का तुम्हाला आमचं <lang:Foreign>office</lang:Foreign> आणि तुमचं घर? |
99.682 100.757 | हो माझं <lang:Foreign>office</lang:Foreign> |
100.875 105.275 | आणि तुमचं <lang:Foreign>office</lang:Foreign> जवळ आहे तर मला तुमच्याकडे (()) सरळ <lang:Foreign>office</lang:Foreign> नंतर |
105.674 108.875 | तुम्ही फक्त मला <lang:Foreign>detail</lang:Foreign> सांगून द्या. त्याप्रमाणे मी पैसे भरीन. |
106.200 106.974 | बरं. |
110.099 110.875 | चालेल. |
111.224 117.700 | तर भारतातले तुम्ही मला चार जागा सांगितल्या. एक कुलू मनाली सांगितलं. शिमला सांगितलं |
118.400 121.700 | आणि काश्मीर आणि <lang:Foreign>statue of unity</lang:Foreign>चं |
122.025 122.875 | बरोबर आहे? |
125.575 126.250 | हो. |
126.250 131.275 | <lang:Foreign>okay</lang:Foreign> आणि तुम्ही सगळ्या ठिकाणी <lang:Foreign>flights</lang:Foreign>नी जाणार आहे कसं आहे तुमचा <lang:Foreign>plan</lang:Foreign> तो? |
133.175 138.973 | हो. जे सर्व जवळपास जे <lang:Foreign>airport</lang:Foreign> आहेत तिकडनं <lang:Foreign>flight</lang:Foreign> घेऊ आम्ही. <lang:Foreign>flight</lang:Foreign> बघू तिकडनं पुढे गाडी घेऊन जाता येईल मग आम्हाला. |
139.500 143.250 | मग <lang:Foreign>car</lang:Foreign> तुम्ही <lang:Foreign>car</lang:Foreign> म्हणजे <lang:Foreign>rent</lang:Foreign> वर राहील |
143.550 149.598 | किंवा आम्ही <lang:Foreign>arrange</lang:Foreign> करून देऊ तुम्हाला <lang:Foreign>flight</lang:Foreign>च्या तिकडनं म्हणजे <lang:Foreign>airport</lang:Foreign> वरनं <lang:Foreign>car</lang:Foreign> तुम्हाला <lang:Foreign>arrange</lang:Foreign> केली जाईल. |
150.949 156.074 | तिकडनं तुम्ही <lang:Foreign>car</lang:Foreign>नी फिरू शकता. चौघचं जण आहे तर जास्त मोठी गाडी पण तुम्हाला लागणार नाही. |
157.973 165.150 | <lang:Foreign>Innova</lang:Foreign> बरोबर राहील कारण सामान पण तुमचं मावून जाईल आणि तुम्हालाही आरामात बसता येईल चौघांनाही. |
158.848 160.199 | हो. आम्हाला |
167.624 172.800 | हो हो. तसंच करा तुम्ही <lang:Foreign>Innova</lang:Foreign> ठेवा किंवा <lang:Foreign>Fortuner</lang:Foreign> दिली तरी चालण्यासारखं आहे. |
173.275 174.723 | हा मग <lang:Foreign>Fortuner</lang:Foreign> |
173.275 176.550 | जेवढी मोठी आराम आराम देतील तेवढं चांगलं आहे आम्हाला. |
177.324 180.848 | मग <lang:Foreign>Fortuner</lang:Foreign> चांगली राहिलं तर तीच बघूया आपण. |
Marathi
mr-in
India
Varhadi,...more
M:55, F:45
18-70
Silent, Noisy
16 bit
wav
8khz
Dual separate channel
5-15 minutes
Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.
Download Free Dataset
Contact Us