Guides
Breadcrumbs

TTS Verbalization Guide and Specification for el-GR

Introduction

This document describes how specific series of strings are read by the Text-To-Speech (TTS) Engine for the Greek language in the GR domain. All specifications and usage are valid for the following solutions:

Voice Pack

Version

Release Date

el-GR Nefeli Female Voice Pack

1.1.2

And for the TTS Engine version 2.6.0.

Numbers

Integers

Integers less than 1000

Format

Example

Input String

Verbalized Form

[1-9][0-9]

25

είκοσι πέντε

[1-9][0-9]

31

τριάντα ένα

[1-9][0-9]…​[0-9]

159

εκατόν πενήντα εννέα

<dash> [1-9]…​[0-9]

-58

μείον πενήντα οκτώ

Integers greater than 999

Allowed thousands delimiters

  • Dot

  • None

Space delimiter results in two separate number groups.

Format

Example

Input String

Verbalized Form

[1-9][0-9]…​[0-9][0-9]

2824

δύο χιλιάδες οκτακόσια είκοσι τέσσερα

[1-9] <dot> [0-9]…​[0-9][0-9]

2.824

δύο χιλιάδες οκτακόσια είκοσι τέσσερα

[1-9][0-9][0-9] <dot> [1-9][0-9][0-9] <dot> [1-9][0-9][0-9]

857.467.987

οκτακόσια πενήντα επτά εκατομμύρια τετρακόσιες εξήντα επτά χιλιάδες εννιακόσια ογδόντα επτά

[1-9][0-9][0-9][1-9][0-9][0-9][1-9][0-9][0-9]

857467987

οκτακόσια πενήντα επτά εκατομμύρια τετρακόσιες εξήντα επτά χιλιάδες εννιακόσια ογδόντα επτά

<dash> [1-9][0-9][0-9]…​[0-9]

-12345

μείον δώδεκα χιλιάδες τριακόσια σαράντα πέντε

<dash> [1-9] <dot> …​ <dot> [1-9][0-9][0-9]

-12.345

μείον δώδεκα χιλιάδες τριακόσια σαράντα πέντε

Maximum supported value is 999 billions. Numbers greater than this are be spelled number by number.

Decimals

Allowed decimal separator

  • comma

The individual numbers after the dot delimiter are spelled as single digits.

Format

Example

Input String

Verbalized Form

[1-9]…​[0-9] <comma> [0-9][0-9]…​[0-9]

2,4527

δύο κόμμα τέσσερα πέντε δύο επτά

<dash> [1-9]…​[0-9] <comma> [0-9][0-9]…​[1-9]

-25,78

μείον είκοσι πέντε κόμμα επτά οκτώ

Number groups

Format

Example

Input String

Verbalized Form

[0-9] <dash> …​ [0-9] <space> [0-9] <dash> …​ [0-9] <space> …​

4-2-1-4 2-3-4 7-5-3

τέσσερα δύο ένα τέσσερα, δύο τρία τέσσερα, επτά πέντε τρία

16-digit card numbers

Card numbers belong to the number groups. In order to pronounce the 16-digit card number in groups of four digits with a short pause in between them, the input number has to contain the dashes, for example:

"Για επιβεβαίωση, είπατε 5-8-9-7 4-2-6-5 1-2-3-4 7-4-6-8 9-7-2-6, σωστά;"

Input text in the format of: "5896 4265 1234 7468 9726"

results in: "πέντε χιλιάδες οκτακόσια ενενήντα έξι τέσσερις χιλιάδες διακόσια εξήντα πέντε,…​​"

Telephone numbers

Telephone numbers should be composed as number groups also. The following example:

"Ο αριθμός τηλεφώνου σας είναι 3-8-7 8-5-6 9-3-0."

would be read as "τρία οκτώ επτά <short pause> οκτώ πέντε έξι <short pause> εννέα τρία μηδέν".

Combination of numbers and words

Format

Example

Input String

Verbalized Form

{word} <dash> [0-9] …​ [0-9]

COVID-19

κόβιντ δεκαεννέα

Beware of using spaces. When the dash sign is surrounded by space, it is verbalized as word "dash". For example, the verbalization of "COVID - 19" is "κόβιντ παύλα δεκαεννέα".

Ratio

Format

Example

Input String

Verbalized Form

[0-9] …​ [0-9] <colon> [0-9] …​ [0-9]

16:9

δεκαέξι προς εννέα

[0-9] …​ [0-9] <dash> [0-9] …​ [0-9]

16-9

δεκαέξι έως εννέα

Percentage

Format

Example

Input String

Verbalized Form

[1-9]…​[0-9] <percent sign>

15%

δεκαπέντε τοις εκατό

Time

Format

Example

Input String

Verbalized Form

[00-99] <colon> [00-59] <colon> [00-59]

12:11:01

δώδεκα ώρες έντεκα λεπτά και ένα δευτερόλεπτο

[00-24] <colon> [00-59]

23:15

είκοσι τρείς και δεκαπέντε

[1-12] <space> {ΜΜ, ΠΜ}

2 ΜΜ

δύο μετά μεσημβρίαν

[1-12] <space> {π.μ., μ.μ.}

11 ΠΜ

έντεκα προ μεσημβρίας

[1-12] <colon> [00-59] <space> {ΜΜ, ΠΜ}

10:23 ΠΜ

δέκα και είκοσι τρία προ μεσημβρίας

[1-12] <colon> [00-59] <space> {π.μ., μ.μ.}

10:30 μ.μ.

δέκα και τριάντα μετά μεσημβρίαν

00:00

00:00

μεσάνυχτα

Date

Format

Example

Input String

Verbalized Form

[1-31] <space> {μήνας} <space> [0-9][0-9][0-9][0-9]

14 Μάιος 2022

δεκατέσσερις Μαΐου δύο χιλιάδες είκοσι δύο

[1-31] <space> {μήνας}

14 Μάιος

δεκατέσσερις Μαΐου

{μήνας} <space> [1-31] <comma> <space> [1-9][0-9][0-9][0-9]

Ιουνίου 6, 2020

έξι Ιουνίου δύο χιλιάδες είκοσι

{μήνας} <space> [1-31]

Ιούνιος 6

έξι Ιουνίου

[00-31] <slash> [00-12] <slash> [1-9][0-9]

31/12/19

τριάντα μία Δεκεμβρίου δύο χιλιάδες δεκαεννέα

[00-12] <slash> [00-31] <slash> [1-9][0-9]

12/31/22

τριάντα μία Δεκεμβρίου δύο χιλιάδες είκοσι δύο

[00-31] <dash> [00-12] <dash> [1-9][0-9][0-9][0-9]

27-05-2021

είκοσι επτά Μαΐου δύο χιλιάδες είκοσι ένα

[00-31] <dot> [00-12] <dot> [1-9][0-9][0-9][0-9]

27.05.2021

είκοσι επτά Μαΐου δύο χιλιάδες είκοσι ένα

[0-31] <dot> [0-12] <dot> [1-9][0-9][0-9][0-9]

27.5.2021

είκοσι επτά Μαΐου δύο χιλιάδες είκοσι ένα

[1-9][0-9][0-9][0-9] <dash> [00-12] <dash> [00-31]

2022-11-02

δύο Νοεμβρίου δύο χιλιάδες είκοσι δύο

[00-31] <slash> [00-12]

05/12

πέντε Δεκεμβρίου

Units

Format

Example

Input String

Verbalized Form

{amount} {unit}

2,5 GB

δύο κόμμα πέντε γιγαμπάιτ

{amount} <space> {unit}

3 m

τρία μέτρα

{amount} {unit} <slash> {unit}

1500 MB/s

χίλια πεντακόσια μεγαμπάιτ ανά δευτερόλεπτο

{amount} <space> {unit} <slash> {unit}

1 km/h

ένα χιλιόμετρο ανά ώρα

Unit

Abbreviation

Verbalization

Abbreviation

Verbalization

mm

χιλιοστό/ά

cm

εκατοστό/ά

m

μέτρο/α

km, Km

χιλιόμετρο/α

m², m2

τετραγωνικό/ά μέτρο/α

m³, m3

κυβικό/ά μέτρο/α

", in

ίντσα/ες

ft

πόδι/α

yd

γιάρδα/ες

mi

μίλι/α

mph, MPH

μίλια ανά ώρα

h, hr

ώρα/ες

min, mins

λεπτό/ά

s

δευτερόλεπτο/α

g, gm

γραμμάριο/α

kg, Kg

κιλό/ά

oz

ουγγιά/ές

lb, lbs

λίβρα/ες

ml, mL

χιλιοστόλιτρο/α

cl, cL

εκατοστόλιτρο/α

l, L

λίτρο/α

gal

γαλόνι/α

Hz, hz

χερτζ

kHz, KHz, khz

κιλοχέρτζ

MHz

μεγαχέρτζ

GHz, Ghz, ghz

γιγαχέρτζ

mW

μιλιβάτ

w, W

βατ

kW, KW

κιλοβάτ

MW

μεγαβάτ

GW

γιγαβάτ

kwh, kWh, KWh

κιλοβατώρα/ες

v, V

βολτ

mA

μιλιαμπέρ

A

αμπέρ

db, dB

ντεσιμπέλ

kb, Kb, kbit

κιλομπίτ

mb, Mb, Mbit

μεγαμπίτ

gb, Gb, Gbit

γιγαμπίτ

tb, Tb, Tbit

τεραμπίτ

pb, Pb, Pbit

πεταμπίτ

bps

μπιτ ανά δευτερόλεπτο

Kbps

κιλομπίτ ανά δευτερόλεπτο

Mbps

μεγαμπίτ ανά δευτερόλεπτο

Gbps

γιγαμπίτ ανά δευτερόλεπτο

Tbps

τεραμπίτ ανά δευτερόλεπτο

kB, KB

κιλομπάιτ

MB

μεγαμπάιτ

GB

γιγαμπάιτ

TB

τεραμπάιτ

PB

πεταμπάιτ

kBps, KBps

κιλομπάιτ ανά δευτερόλεπτο

MBps

μεγαμπάιτ ανά δευτερόλεπτο

GBps

γιγαμπάιτ ανά δευτερόλεπτο

TBps

τεραμπάιτ ανά δευτερόλεπτο

PBps

πεταμπάιτ ανά δευτερόλεπτο

°C, °c

βαθμοί Κελσίου

°F, °f

βαθμοί Φαρενάιτ

Words

Abbreviations and Spelling

Format

Example

Input String

Verbalized Form

[A-Z]…​[A-Z]

ΑΒΓ

Α Β Γ

[A-Z] <dot\> [A-Z] <dot> …​ [A-Z] <dot>

Χ.Τ.

Χ Τ

[a-z] <dot> [a-z] <dot> …​ [a-z] <dot>

π.χ.

παραδείγματος χάριν

[a-zA-Z] , όπως [a-zA-Z]

κ, όπως Κώστας

Κ, όπως Κώστας

{common abbreviation}

Δρ.

δόκτωρ

<space> [A-Z] {<comma>, <dot>, <space>}

Α ή Β

Α ή Β

All the capitalized letters are supposed to be spelled.

Common abbreviation

Abbreviation

Verbalization

Abbreviation

Verbalization

δρ. / Δρ.

δόκτωρ

κ.

κύριος

π.χ.

παραδείγματος χάριν

κα.

κυρία

κλπ. / κ.λπ.

και λοιπά

κ.τ.λ.

και τα λοιπά

κ.ά.

και άλλα

π.Χ.

προ Χριστού

μ.Χ.

μετά Χριστόν

Αρ.

αριθμός

χλμ.

χιλιόμετρα

Α.Ε.

ανώνυμη εταιρεία

Ε.Π.Ε.

εταιρεία περιορισμένης ευθύνης

Ν.Π.Δ.Δ.

νομικό πρόσωπο δημοσίου δικαίου

Ν.Π.Ι.Δ.

νομικό πρόσωπο ιδιωτικού δικαίου

ο.ε.

ομόρρυθμη εταιρεία

ε.ε.

ετερόρρυθμη εταιρεία

κ.υ.α.

κοινή υπουργική απόφαση

Υ.Γ.

υστερόγραφο

Δ.Ε.Η.

δημόσια επιχείρηση ηλεκτρισμού

Ο.Τ.Ε.

οργανισμός τηλεπικοινωνιών Ελλάδος

Ε.Ε.

ευρωπαϊκή ένωση

Η.Π.Α.

ηνωμένες πολιτείες Αμερικής

Ε.Ε.Π.

ειδικό εκπαιδευτικό προσωπικό

Ε.Ε.Δ.Ε.

ελληνική εταιρεία διοικήσεως επιχειρήσεων



Dashed words

Format

Example

Input String

Verbalized Form

[a-Z] …​ [a-z] <dash> [a-Z] …​ [a-z]

ψηφιακή-πύλη

ψηφιακή πύλη

[a-Z]…​[a-z] <space> <dash> <space> [a-Z] …​ [a-z]

Αθήνα - Θεσσαλονίκη

Αθήνα παύλα Θεσσαλονίκη

URLs and E-mails

Format

Example

Input String

Verbalized Form

(www) <dot> {word} <dot> {domain}

google.com

γκούγκλ τελεία κομ

{word} <at sign> {word} <dot> {domain}

info@omilia.com

I N F O παπάκι ομιλία τελεία κομ

Currency

Format

Example

Input String

Verbalized Form

{currency symbol} {amount}

$25,10

είκοσι πέντε δολάρια και δέκα σεντς

£25.000

είκοσι πέντε χιλιάδες λίρες

{amount} {currency symbol}

25,10€

είκοσι πέντε ευρώ και δέκα λεπτά

{amount} <space> {currency code}

25 USD

είκοσι πέντε αμερικανικά δολάρια

{currency code} <space> {amount}

GBP 25

είκοσι πέντε λίρες στερλίνες

{currency symbol} {amount} <space> {quantity}

$1,3 εκατομμύρια

ένα κόμμα τρία εκατομμύρια δολάρια

{amount} <space> {quantity} <space> {currency code}

1 εκατομμύριο USD

ένα εκατομμύριο αμερικανικά δολάρια

Currency code

Code

Verbalized form

Subdivision

EUR

ευρώ

λεπτό / λεπτά

USD

αμερικανικό δολάριο / αμερικανικά δολάρια

σεντ / σεντς

GBP

λίρα στερλίνα / λίρες στερλίνες

πένα / πένες

CAD

καναδικό δολάριο / καναδικά δολάρια

σεντ / σεντς

AUD

αυστραλιανό δολάριο / αυστραλιανά δολάρια

σεντ / σεντς

UAH

χρίβνια / χρίβνιες

καπίκι / καπίκια

JPY

ιαπωνικό γεν / ιαπωνικά γιεν

RMB

κινέζικο γουάν / κινέζικα γουάν

Currency symbol

Symbol

Verbalized form

ευρώ

$

δολάριο

£

λίρα

χρίβνια

Amount examples

Amount

Verbalized form

$235.125.250,12

διακόσια τριάντα πέντε εκατομμύρια εκατόν είκοσι πέντε χιλιάδες διακόσια πενήντα δολάρια και δώδεκα σεντς

$3,458

τρία κόμμα τέσσερα πέντε οκτώ δολάρια

$5.000,00

πέντε χιλιάδες δολάρια

$0,01

ένα σεντ

$-0,01

μείον ένα σεντ

Quantity

εκατομμύριο / εκατομμύρια

δισεκατομμύριο / δισεκατομμύρια

τρισεκατομμύριο / τρισεκατομμύρια

Punctuation and Characters Processing

Supported characters

Char

Description

Used as/in

Char

Description

Used as/in

.

period

sentence ending

@

at sign

email address

thousands separator

-

dash

number group

,

comma

sentence break

word group

decimal separator

minus sign

;

question mark

sentence ending

+

plus sign

math equation

!

exclamation mark

sentence ending

$

dollar sign

part of currency

'

apostrophe

contraction

euro sign

part of currency

possessive noun

£

pound sign

part of currency

%

percent sign

percentage value

&

ampersand

and

Other characters or punctuation are removed and do not affect the voice.

Punctuation

If no punctuation is present in the input text, the period is added automatically. There is no check of the sentence content or a type in order to distinguish the punctuation.

Thank you for using our service → Thank you for using our service.

What can I do for you → What can I do for you.

Char

Description

Effect

.

period

falling intonation

?/;

question mark

raising intonation

 

space

pause

-

dash

short pause

,

comma

falling intonation

!

exclamation mark

increased intensity

The question mark does not always result in rising intonation. It follows the question intonation rules of en-US referring to rising, falling and rise-fall intonation for yes/no, wh- or multiple choice questions.

Examples

This section illustrates the examples of common prompts and verbalization usage.

Input:

"Καλημέρα, πώς μπορώ να σας βοηθήσω;"

Verbalized output:

"Καλημέρα, πώς μπορώ να σας βοηθήσω;"


Input:

"Η διαδικασία διαρκεί μόλις 20 λεπτά."

Verbalized output:

"Η διαδικασία διαρκεί μόλις είκοσι λεπτά."


Input:

"Ο αριθμός σας: 5-8-9-7 4-2-6-5 1-2-3-4 7-4-6-8 9-7-2-6."

Verbalized output:

"Ο αριθμός σας πέντε οκτώ εννέα επτά, τέσσερα δύο έξι πέντε, ένα δύο τρία τέσσερα, επτά τέσσερα έξι οκτώ, εννέα επτά δύο έξι."


Input:

"Το υπόλοιπό σας, $25,10."

Verbalized output:

"Το υπόλοιπό σας, είκοσι πέντε δολάρια και δέκα σεντς."


Input:

"Στείλτε email στο info@omilia.com."

Verbalized output:

"Στείλτε email στο I N F O παπάκι ομιλία τελεία κομ."


Input:

"Είμαστε ανοιχτά 24 ώρες 365 ημέρες τον χρόνο."

Verbalized output:

"Είμαστε ανοιχτά είκοσι τέσσερις ώρες τριακόσιες εξήντα πέντε ημέρες τον χρόνο."


Input:

"Το υπόλοιπό σας -1,35 USD."

Verbalized output:

"Το υπόλοιπό σας μείον ένα αμερικανικό δολάριο και τριάντα πέντε σεντς."