Você tem a ideia certa, com certeza; você pode obter a data e hora mais recente do banco de dados e inserir apenas itens mais recentes que isso, ou (se você quiser ser realmente completo) obter tudo do banco de dados, comparar com tudo no feed e inserir apenas itens que não corresponder a algo que já está no banco de dados. Mas se você realmente deseja INSERT apenas para inserir novos dados, conforme implícito no título da pergunta,
INSERT IGNORE
é o caminho a seguir e, sem dúvida, a implementação mais simples também. A menos que você tenha uma preocupação com a quantidade de tráfego no banco de dados, eu continuaria com isso.