final String r = a.replaceAll(" .*?(?=_)", ""); se você imprimir o r, deu saída: 000003023_AggregateStopLossLimit_W_2012-12-22.PDF