<div dir="ltr">Hi Joan,<div><br></div><div>Thanks for your advise, I got the result back for the text: How are you. as attached,  but there are some values I am not sure what they mean, like for &quot;h&quot;, there are two values: 0.075 and 125, does the value 0.075 mean how long it takes to speak &quot;h&quot; in seconds? and also 125 is hardcoded value in the source code, what does it mean for &quot;h&quot;?</div><div><br></div><div>Thanks for your help!</div><div>







<p class="gmail-p1">text: #</p>
<p class="gmail-p1">0.075 125 h</p>
<p class="gmail-p1">0.24000001 125 aU</p>
<p class="gmail-p1">0.275 125 A</p>
<p class="gmail-p1">0.345 125 r</p>
<p class="gmail-p1">0.435 125 j</p>
<p class="gmail-p1">0.58000004 125 u</p>
<p class="gmail-p1">0.75500005 125 _</p><p class="gmail-p1"><br></p><p class="gmail-p1"><br></p></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Apr 18, 2017 at 6:13 AM, Joan Pere Sanchez <span dir="ltr">&lt;<a href="mailto:kaiserjp@gmail.com" target="_blank">kaiserjp@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div>Hello again,<br><br></div>If you want to obtain phonemes and duration for lip-sync, you must to call:<br><br>            mary.setOutputType(&quot;REALISED_<wbr>DURATIONS&quot;);<br><br></div>Where you would see each phoneme and their duration. You can also use another output option to see the features of the tokens, this is:<br>            mary.setOutputType(&quot;<wbr>TARGETFEATURES&quot;);<br><br></div>In both command lines &#39;mary.&#39; is the instance of &#39;LocalMaryinterface&#39; classe to manage your input.<br><br></div>Best,<br><br><div><div><br></div></div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">2017-04-16 2:41 GMT+02:00 idoor <span dir="ltr">&lt;<a href="mailto:idoorlab88@gmail.com" target="_blank">idoorlab88@gmail.com</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Joan,<div><br></div><div>Thanks for your response again!</div><div>I looked at this marytts-txt2wav before, I tested and got the double array:</div><div><span class="m_6545465782882453944m_1878463728601568549gmail-pl-k" style="box-sizing:border-box;color:rgb(167,29,93);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">double</span><span style="color:rgb(36,41,46);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">[] samples </span><span class="m_6545465782882453944m_1878463728601568549gmail-pl-k" style="box-sizing:border-box;color:rgb(167,29,93);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">=</span><span style="color:rgb(36,41,46);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap"> </span><span class="m_6545465782882453944m_1878463728601568549gmail-pl-smi" style="box-sizing:border-box;color:rgb(51,51,51);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">MaryAudioUtils</span><span class="m_6545465782882453944m_1878463728601568549gmail-pl-k" style="box-sizing:border-box;color:rgb(167,29,93);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">.</span><span style="color:rgb(36,41,46);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">getSamplesAsDou<wbr>bleArray(audio);</span><br></div><div><span style="color:rgb(36,41,46);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap"><br></span></div><div><span style="color:rgb(36,41,46);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">but after I got that far, I do not know what to do next to get phonemes, is this double [] related to phonemes?</span></div><div><span style="color:rgb(36,41,46);font-family:sfmono-regular,consolas,&#39;liberation mono&#39;,menlo,courier,monospace;font-size:12px;line-height:20px;white-space:pre-wrap">Best regards,</span></div><div><br></div></div><div class="m_6545465782882453944HOEnZb"><div class="m_6545465782882453944h5"><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Apr 15, 2017 at 7:01 PM, Joan Pere Sanchez <span dir="ltr">&lt;<a href="mailto:kaiserjp@gmail.com" target="_blank">kaiserjp@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div>Hi Dave,<br><br></div>You can take a look at this example to see how to extract from MaryTTS the time-duration for each phoneme at the same time you have the phonemes in SAMPA notation transcribed:<br><br><a href="https://github.com/marytts/marytts-txt2wav" target="_blank">https://github.com/marytts/mar<wbr>ytts-txt2wav</a><br><br></div>In MaryTTS you have several option as input (text, BML, SSML, and many other) and also they are several output options. You can run the demo compilation with the server-client solution and through the interface see the options (there are a lot)<br><br></div>Best,<br><br></div><div class="m_6545465782882453944m_1878463728601568549HOEnZb"><div class="m_6545465782882453944m_1878463728601568549h5"><div class="gmail_extra"><br><div class="gmail_quote">2017-04-15 22:45 GMT+02:00 idoor <span dir="ltr">&lt;<a href="mailto:idoorlab88@gmail.com" target="_blank">idoorlab88@gmail.com</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi Joan,<div><br></div><div>Thanks for your response, do you have any pointers of references I can read and study? does MaryTTS provide any audio data for analysis of phonemes and visemes? MaryTTS can generate .wav file, is that possible to find a library tool to analyze the wave file and get phonemes info? I found this javadoc </div><div><a href="http://elckerlyc.sourceforge.net/javadoc/Hmi/hmi/tts/mary/MaryTTSGenerator.html" target="_blank">http://elckerlyc.sourceforge.n<wbr>et/javadoc/Hmi/hmi/tts/mary/Ma<wbr>ryTTSGenerator.html</a><br></div><div>but I could not find the souce code for this, have you happened to see the library jar file or source code for this?</div><div><br></div><div>Thanks again for sharing some thoughts with me.</div><div><br></div><div><br></div><div><br></div></div><div class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058HOEnZb"><div class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058h5"><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Apr 15, 2017 at 2:05 PM, Joan Pere Sanchez <span dir="ltr">&lt;<a href="mailto:kaiserjp@gmail.com" target="_blank">kaiserjp@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div>Hi Dave,<br><br></div>This task is the main goal of my PhD thesis. I&#39;m doing lip-sync from the input text over the time duration estimation done while the speech is generated. You can develop your own strategy for lip/mouth synchronization, but often this is an avatar (or interface -I&#39;m using a talking head too-) dependent task. So, if you are using an avatar, it depends if you can use blend shapes to mix by interpolation from the initial pose to the next one. Most of MPEG-4 systems are able to do that automatically.<br></div>On one hand, you have each phoneme and their start and finish time. On the other hand, you can adjust a set of visemes for each basic expression (no more than 15 are needed) and then choose the sequence corresponding to each word you are generating. It&#39;s the more efficient and simple way to have an effective lip synchronization.<br></div>Don&#39;t hesitate to contact me if you want more info or refs about.<br><br></div>Bes regards,<br><br></div><div class="gmail_extra"><br><div class="gmail_quote"><div><div class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058m_8648884777156356534h5">2017-04-15 18:27 GMT+02:00 idoor Du <span dir="ltr">&lt;<a href="mailto:idoorlab88@gmail.com" target="_blank">idoorlab88@gmail.com</a>&gt;</span>:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058m_8648884777156356534h5"><div dir="ltr">Hi all,<div><br></div><div>I am new to MaryTTS, tried to call its API via:</div><div><br></div><div>AudioInputStream audio = mary.generateAudio(&quot;testing&quot;);</div><div><br></div><div>Now I want to animate mouth/lip shapes at runtime based on the audio sound, how to achieve that? are there any <span style="color:rgb(36,39,41);font-family:arial,&#39;helvetica neue&#39;,helvetica,sans-serif;font-size:15px;line-height:15.6px">viseme</span> data associated with the audio?</div><div><br></div><div>Thanks in advance.</div><div><br></div><div>Dave</div></div>
<br></div></div>______________________________<wbr>_________________<br>
Mary-users mailing list<br>
<a href="mailto:Mary-users@dfki.de" target="_blank">Mary-users@dfki.de</a><br>
<a href="http://www.dfki.de/mailman/cgi-bin/listinfo/mary-users" rel="noreferrer" target="_blank">http://www.dfki.de/mailman/cgi<wbr>-bin/listinfo/mary-users</a><br>
<br></blockquote></div><span class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058m_8648884777156356534HOEnZb"><font color="#888888"><br><br clear="all"><br>-- <br><div class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058m_8648884777156356534m_1722454488195543617gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div><b>Joan Pere Sànchez Pellicer</b><br></div><a href="mailto:kaiserjp@gmail.com" target="_blank">kaiserjp@gmail.com</a><br></div><a href="http://www.chamaleon.net" target="_blank">www.chamaleon.net</a><br><a href="tel:+34%20625%2001%2027%2041" value="+34625012741" target="_blank">+34 625 012 741</a><br></div></div>
</font></span></div>
</blockquote></div><br></div>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><div class="m_6545465782882453944m_1878463728601568549m_-4502980371919045058gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div><b>Joan Pere Sànchez Pellicer</b><br></div><a href="mailto:kaiserjp@gmail.com" target="_blank">kaiserjp@gmail.com</a><br></div><a href="http://www.chamaleon.net" target="_blank">www.chamaleon.net</a><br><a href="tel:+34%20625%2001%2027%2041" value="+34625012741" target="_blank">+34 625 012 741</a><br></div></div>
</div>
</div></div></blockquote></div><br></div>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><div class="m_6545465782882453944gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div><b>Joan Pere Sànchez Pellicer</b><br></div><a href="mailto:kaiserjp@gmail.com" target="_blank">kaiserjp@gmail.com</a><br></div><a href="http://www.chamaleon.net" target="_blank">www.chamaleon.net</a><br><a href="tel:+34%20625%2001%2027%2041" value="+34625012741" target="_blank">+34 625 012 741</a><br></div></div>
</div>
</div></div></blockquote></div><br></div>