Marathi (India) Call Center Speech Dataset for Delivery & Logistics

The audio dataset includes call center conversations in Delivery & Logistics, featuring native Marathi speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

40 Speech Hours

Last updated

July 2023

Number of participants

80

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Marathi Language Call Center Speech Dataset for the Delivery and Logistics domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Delivery and Logistics industry.

With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Delivery and Logistics domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Marathi language spoken in India.

Speech Data:

This training dataset comprises 40 hours of call center audio recordings covering various topics and scenarios related to the Delivery and Logistics domain, to build robust and accurate customer service speech technology.

To curate realistic call center interactions, we collaborated with a diverse network of 80 expert native Marathi speakers from different part of Maharashtra. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.

Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.

The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.

Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.

The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Marathi language call center speech recognition models for the Delivery and Logistics domain.

Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.

These ready-to-use transcriptions accelerate the development of Delivery and Logistics call center conversational AI and ASR models for the Marathi language.

Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.

If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.

License:

This Delivery and Logistics call center audio dataset is created by FutureBeeAI and is available for commercial use!

Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Delivery and Logistics sector, our dataset serves as a trusted resource to meet your goals

Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Female(50)Female(20)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech1.2812.347Speaker 1<lang:Foreign>Hello Futurebee</lang:Foreign>
Speech4.3555.392Speaker 2<lang:Foreign>Hello Futurebee</lang:Foreign>
Speech5.9326.628Speaker 1नमस्कार.
Speech7.19810.082Speaker 1मी <PII>अश्विनी</PII> (()) <lang:Foreign>courier</lang:Foreign> मध्ये आपलं स्वागत आहे.
Speech10.48912.035Speaker 1मी आपली काय सेवा करू शकते?
Speech14.08620.315Speaker 2नमस्कार मला एका (()) मला एक <lang:Foreign>Courier</lang:Foreign> चेन्नईला पाठवायचं आहे. त्या विषयी मला थोडी माहिती सांगाल का?
Speech22.39325.658Speaker 1हो <lang:Foreign>madam</lang:Foreign> तुमची वस्तू नेमकी काय आहे ते जरा मला सांगाल का?
Speech26.67330.545Speaker 2हो. माझ्याकडे काही <lang:Foreign>solar</lang:Foreign>च्या <lang:Foreign>cells</lang:Foreign> आहे त्या मला एका
Speech30.82934.029Speaker 2<lang:Foreign>project</lang:Foreign>साठी माझ्या मैत्रिणीच्या <lang:Foreign>company</lang:Foreign>मध्ये पाठवायच्या आहे.
Speech34.26538.215Speaker 2तर या <lang:Foreign>cells</lang:Foreign> फार नाजूक आहे म्हणजे जराश्या धक्क्याने सुद्धा त्या तुटू शकतात.
Speech38.48442.152Speaker 2त्यामुळे त्या व्यवस्थित चेन्नईला कशाप्रकारे पोहचू शकतात हे मला
Speech42.24343.543Speaker 2जाणून घ्यायचं आहे.
Speech45.89048.670Speaker 1<lang:Foreign>okay madam</lang:Foreign> तुम्ही अगदी योग्य ठिकाणी माहिती घेत आहात.
Speech48.83452.042Speaker 1[filler]आम्ही अशा अनेक वस्तू व्यवस्थितपणे त्या त्या जागी पोहोचवल्या आहेत.
Speech52.47255.847Speaker 1यात अगदी मातीच्या भांडयांपासून ते <lang:Foreign>electronic</lang:Foreign>च्या वस्तू सुद्धा आहे.
Speech56.45961.286Speaker 1तुम्ही सांगत असलेले <lang:Foreign>solar</lang:Foreign>च्या <lang:Foreign>cells</lang:Foreign> सुद्धा आम्ही व्यवस्थित पोहचवू या विषयी आपण निश्चिन्त राहा.
Speech63.68665.409Speaker 2पण यासाठी मला काय करावे लागेल?
Speech66.62973.679Speaker 1मला आणखी एक सांगा की तुम्ही वस्तू घेऊन आमच्या <lang:Foreign>office</lang:Foreign> मध्ये याला की आम्ही तुमच्या पत्त्यावर येऊन <lang:Foreign>parcel pickup</lang:Foreign> करायचं आहे?
Speech75.95078.736Speaker 2तुम्ही येऊन <lang:Foreign>parcel pick up</lang:Foreign> केलं तर बरं होईल.
Speech79.93884.668Speaker 1[filler]ठीक आहे मग तुम्हाला आधी आमच्या <lang:Foreign>website</lang:Foreign> वर जाऊन <lang:Foreign>sign up</lang:Foreign> करावं लागेल.
Speech85.21887.552Speaker 1[filler]यात तुम्ही एकदा तुमची सर्व माहिती भरली
Speech88.08791.200Speaker 1की तुम्हाला भविष्यात सुद्धा आमच्या <lang:Foreign>company</lang:Foreign> तर्फे <lang:Foreign>courier</lang:Foreign> करता येईल.
Speech91.94496.986Speaker 1[filler]यात तुम्ही <lang:Foreign>request</lang:Foreign> करू शकता की यात तुम्ही तुमच्या दिलेल्या पत्त्यावर <lang:Foreign>parcel pick up</lang:Foreign> हे मिळणार.
Speech99.602106.706Speaker 2पण जसं मी सांगितलं की ह्या <lang:Foreign>cells</lang:Foreign> फार नाजूक असतात मग त्यांना व्यवस्थित <lang:Foreign>packing</lang:Foreign> पण करावी लागेल. मग त्यासाठी काय करावे लागेल?
Speech107.709114.760Speaker 1[filler]<lang:Foreign>madam</lang:Foreign> आमच्या <lang:Foreign>website</lang:Foreign> वर तुम्ही <lang:Foreign>courier now</lang:Foreign> ह्या विभागात गेल्यावर तुम्हाला तिथे आमच्या वस्तूंची माहिती भरायची आहे.
Speech115.302119.858Speaker 1म्हणजे तुमच्या तुमची जी वस्तू पाठवायची आहे चेन्नईला त्याची माहिती भरायची आहे.
Speech120.364123.530Speaker 1यातच एक <lang:Foreign>menu</lang:Foreign> आहे त्यात तुम्हाला <lang:Foreign>packing</lang:Foreign> पण हवं आहे
Speech123.751126.451Speaker 1की नकोय असं (()) मध्ये असतील.
Speech126.810131.056Speaker 1त्यातील हवं आहे यावर जर तुम्ही <lang:Foreign>click</lang:Foreign> केलं तर पुढे येणाऱ्या <lang:Foreign>window</lang:Foreign> मध्ये
Speech131.172133.597Speaker 1तुमच्या वस्तूची <lang:Foreign>size</lang:Foreign> तुम्हाला टाकायची आहे.
Speech134.110138.497Speaker 1त्यातच असलेल्या एका <lang:Foreign>menu delicate</lang:Foreign> ह्या विभागावर तुम्ही <lang:Foreign>click</lang:Foreign> करायचं आहे.
Speech139.149141.585Speaker 1मग तुमचा <lang:Foreign>available</lang:Foreign> वेळ विचारला जाईल.
Speech142.020144.907Speaker 1तुम्ही साधारणपणे दिलेल्या पत्त्यावर कधी उपलब्ध असाल.
Speech145.454146.705Speaker 1हे त्यात लिहायचं आहे.
Speech147.162149.024Speaker 1अशी सर्व माहिती (()) भरून झाली.
Speech149.454152.026Speaker 1की मग तुम्हाला आमच्या प्रतिनिधी कडून एक <lang:Foreign>call</lang:Foreign> येईल.
Speech152.550155.109Speaker 1त्याला तुम्ही तुमच्या <lang:Foreign>solar cells</lang:Foreign> विषयी सांगू शकता.
Speech155.622160.127Speaker 1म्हणजे तो अशा नाजूक गोष्टींच्या <lang:Foreign>packing</lang:Foreign>साठी ज्या गोष्टी आवश्यक आहे त्या
Speech160.556163.336Speaker 1तुमच्या दिलेल्या पत्त्यावरती येणाऱ्या माणसासोबत पाठवेल.
Speech163.925165.282Speaker 1मग तो माणूस <lang:Foreign>packing</lang:Foreign> करेल.
Speech169.723174.568Speaker 2मला हे जरा समजलं नाही की जी आता तुम्ही प्रक्रिया सांगितली <lang:Foreign>please</lang:Foreign> मला परत सांगाल का?
Speech175.211183.598Speaker 1हो <lang:Foreign>madam</lang:Foreign> नक्कीच. कसं आहे आमची जी <lang:Foreign>website</lang:Foreign> आहे ना (()) <lang:Foreign>courier dot com</lang:Foreign> त्याच्यावर तुम्ही जर गेलात तर तिथे <lang:Foreign>courier now</lang:Foreign> नावाचा एक <lang:Foreign>menu</lang:Foreign> असेल.
Speech179.520180.056Speaker 2हा.

TRANSCRIPTION

TIMETRANSCRIPT
1.281
2.347
<lang:Foreign>Hello Futurebee</lang:Foreign>
4.355
5.392
<lang:Foreign>Hello Futurebee</lang:Foreign>
5.932
6.628
नमस्कार.
7.198
10.082
मी <PII>अश्विनी</PII> (()) <lang:Foreign>courier</lang:Foreign> मध्ये आपलं स्वागत आहे.
10.489
12.035
मी आपली काय सेवा करू शकते?
14.086
20.315
नमस्कार मला एका (()) मला एक <lang:Foreign>Courier</lang:Foreign> चेन्नईला पाठवायचं आहे. त्या विषयी मला थोडी माहिती सांगाल का?
22.393
25.658
हो <lang:Foreign>madam</lang:Foreign> तुमची वस्तू नेमकी काय आहे ते जरा मला सांगाल का?
26.673
30.545
हो. माझ्याकडे काही <lang:Foreign>solar</lang:Foreign>च्या <lang:Foreign>cells</lang:Foreign> आहे त्या मला एका
30.829
34.029
<lang:Foreign>project</lang:Foreign>साठी माझ्या मैत्रिणीच्या <lang:Foreign>company</lang:Foreign>मध्ये पाठवायच्या आहे.
34.265
38.215
तर या <lang:Foreign>cells</lang:Foreign> फार नाजूक आहे म्हणजे जराश्या धक्क्याने सुद्धा त्या तुटू शकतात.
38.484
42.152
त्यामुळे त्या व्यवस्थित चेन्नईला कशाप्रकारे पोहचू शकतात हे मला
42.243
43.543
जाणून घ्यायचं आहे.
45.890
48.670
<lang:Foreign>okay madam</lang:Foreign> तुम्ही अगदी योग्य ठिकाणी माहिती घेत आहात.
48.834
52.042
[filler]आम्ही अशा अनेक वस्तू व्यवस्थितपणे त्या त्या जागी पोहोचवल्या आहेत.
52.472
55.847
यात अगदी मातीच्या भांडयांपासून ते <lang:Foreign>electronic</lang:Foreign>च्या वस्तू सुद्धा आहे.
56.459
61.286
तुम्ही सांगत असलेले <lang:Foreign>solar</lang:Foreign>च्या <lang:Foreign>cells</lang:Foreign> सुद्धा आम्ही व्यवस्थित पोहचवू या विषयी आपण निश्चिन्त राहा.
63.686
65.409
पण यासाठी मला काय करावे लागेल?
66.629
73.679
मला आणखी एक सांगा की तुम्ही वस्तू घेऊन आमच्या <lang:Foreign>office</lang:Foreign> मध्ये याला की आम्ही तुमच्या पत्त्यावर येऊन <lang:Foreign>parcel pickup</lang:Foreign> करायचं आहे?
75.950
78.736
तुम्ही येऊन <lang:Foreign>parcel pick up</lang:Foreign> केलं तर बरं होईल.
79.938
84.668
[filler]ठीक आहे मग तुम्हाला आधी आमच्या <lang:Foreign>website</lang:Foreign> वर जाऊन <lang:Foreign>sign up</lang:Foreign> करावं लागेल.
85.218
87.552
[filler]यात तुम्ही एकदा तुमची सर्व माहिती भरली
88.087
91.200
की तुम्हाला भविष्यात सुद्धा आमच्या <lang:Foreign>company</lang:Foreign> तर्फे <lang:Foreign>courier</lang:Foreign> करता येईल.
91.944
96.986
[filler]यात तुम्ही <lang:Foreign>request</lang:Foreign> करू शकता की यात तुम्ही तुमच्या दिलेल्या पत्त्यावर <lang:Foreign>parcel pick up</lang:Foreign> हे मिळणार.
99.602
106.706
पण जसं मी सांगितलं की ह्या <lang:Foreign>cells</lang:Foreign> फार नाजूक असतात मग त्यांना व्यवस्थित <lang:Foreign>packing</lang:Foreign> पण करावी लागेल. मग त्यासाठी काय करावे लागेल?
107.709
114.760
[filler]<lang:Foreign>madam</lang:Foreign> आमच्या <lang:Foreign>website</lang:Foreign> वर तुम्ही <lang:Foreign>courier now</lang:Foreign> ह्या विभागात गेल्यावर तुम्हाला तिथे आमच्या वस्तूंची माहिती भरायची आहे.
115.302
119.858
म्हणजे तुमच्या तुमची जी वस्तू पाठवायची आहे चेन्नईला त्याची माहिती भरायची आहे.
120.364
123.530
यातच एक <lang:Foreign>menu</lang:Foreign> आहे त्यात तुम्हाला <lang:Foreign>packing</lang:Foreign> पण हवं आहे
123.751
126.451
की नकोय असं (()) मध्ये असतील.
126.810
131.056
त्यातील हवं आहे यावर जर तुम्ही <lang:Foreign>click</lang:Foreign> केलं तर पुढे येणाऱ्या <lang:Foreign>window</lang:Foreign> मध्ये
131.172
133.597
तुमच्या वस्तूची <lang:Foreign>size</lang:Foreign> तुम्हाला टाकायची आहे.
134.110
138.497
त्यातच असलेल्या एका <lang:Foreign>menu delicate</lang:Foreign> ह्या विभागावर तुम्ही <lang:Foreign>click</lang:Foreign> करायचं आहे.
139.149
141.585
मग तुमचा <lang:Foreign>available</lang:Foreign> वेळ विचारला जाईल.
142.020
144.907
तुम्ही साधारणपणे दिलेल्या पत्त्यावर कधी उपलब्ध असाल.
145.454
146.705
हे त्यात लिहायचं आहे.
147.162
149.024
अशी सर्व माहिती (()) भरून झाली.
149.454
152.026
की मग तुम्हाला आमच्या प्रतिनिधी कडून एक <lang:Foreign>call</lang:Foreign> येईल.
152.550
155.109
त्याला तुम्ही तुमच्या <lang:Foreign>solar cells</lang:Foreign> विषयी सांगू शकता.
155.622
160.127
म्हणजे तो अशा नाजूक गोष्टींच्या <lang:Foreign>packing</lang:Foreign>साठी ज्या गोष्टी आवश्यक आहे त्या
160.556
163.336
तुमच्या दिलेल्या पत्त्यावरती येणाऱ्या माणसासोबत पाठवेल.
163.925
165.282
मग तो माणूस <lang:Foreign>packing</lang:Foreign> करेल.
169.723
174.568
मला हे जरा समजलं नाही की जी आता तुम्ही प्रक्रिया सांगितली <lang:Foreign>please</lang:Foreign> मला परत सांगाल का?
175.211
183.598
हो <lang:Foreign>madam</lang:Foreign> नक्कीच. कसं आहे आमची जी <lang:Foreign>website</lang:Foreign> आहे ना (()) <lang:Foreign>courier dot com</lang:Foreign> त्याच्यावर तुम्ही जर गेलात तर तिथे <lang:Foreign>courier now</lang:Foreign> नावाचा एक <lang:Foreign>menu</lang:Foreign> असेल.
179.520
180.056
हा.

Dataset Demographics

Details Headline

Language

Marathi

Language code

mr-in

Country

India

Accents

Varhadi,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg