メッセージを使うと秒数でタイミングを合わせなくても会話の順番をコントロールできます。 また、音声合成の発話に時間がかかっても、順番がおかしくなりません。
https://scratch.mit.edu/discuss/post/9163304/